Skip to content

Pseudo-Lab/Hugging-Face-Hub-Garden

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

40 Commits
 
 
 
 

Repository files navigation

🤗 Hugging Face Hub Garden Project 🌿

PseudoLab Discord Community Stars Badge Forks Badge Pull Requests Badge Issues Badge GitHub contributors

Welcome to Hugging Face Hub Garden repository! We aim to cultivate a vibrant AI development community, offering tools and frameworks for dataset creation, model fine-tuning, and knowledge sharing. Join us in advancing the field of Korean language AI through open collaboration and innovation!

🌟 Project Vision

"데이터와 모델로 채우는 모두를 위한 AI 허브 가든"

Hugging Face Hub Garden 프로젝트는 단순한 데이터셋 구축을 넘어, 자신만의 자원을 만들어 세상과 공유하는 과정을 경험하는 여정입니다.

이 프로젝트에서 우리는 각자의 데이터셋을 설계하고, 최적의 모델을 찾아 파인튜닝하며, Hugging Face Hub에 업로드하는 것을 목표로 합니다. 혼자서는 쉽지 않았던 데이터셋 구축과 모델 최적화를 함께 고민하고, 실험하고, 개선하는 과정을 통해 더욱 깊이 있는 인사이트를 쌓을 수 있습니다.

데이터 수집부터 정제, 다양한 파인튜닝 기법 적용, 성능 평가, 데이터셋 개선까지—전 과정을 직접 경험하고, 단순한 학습을 넘어 창작자로 성장하는 기회가 될 것입니다.

우리 함께 허브 정원을 가꿔볼까요? 🌿✨


Hugging Face KREW

Hugging Face KREW가짜연구소의 리서치 팀으로, Hugging Face와 관련된 다양한 스터디 및 기여 활동을 진행하는 커뮤니티입니다. 🤗
이번 10기에서는 다음과 같은 프로젝트를 진행합니다.

Hugging Face KREW는 Hugging Face 본사와 직접 소통할 수 있는 핫라인을 보유한 비영리 커뮤니티입니다.저희는 Hugging Face로부터 다양한 지원을 받아 협업을 진행해왔으며, 그 경험을 바탕으로 더 많은 연구자와 개발자가 AI 기술을 활용할 수 있도록 돕고자 합니다.

현재 Hugging Face에서 제공한 크레딧을 활용하여 데이터셋 제작과 파인튜닝을 위한 컴퓨팅 자원을 지원하고 있으며, 추가적으로 GPU 사용을 더욱 원활하게 지원할 계획입니다.

Hugging Face KREW에 대해 더 알고 싶다면 여기에서 확인해보세요! 🚀✨


🧑 Our Team

역할 이름 기술 스택 배지 주요 관심 분야
Project Manager 김하림   Python PyTorch 생성형 AI, 오픈소스 기여
Member 정재윤   Pytorch Huggingface VLA, CPC, 오픈소스 기여
Member 유용상   python Huggingface fastapi LLM, 대화 시스템, 언어 모델 평가
Member 이정진   Python Huggingface 생성형 AI, Reasoning , 오픈소스 기여
Member 조영준   Python Huggingface 오픈소스 기여, 생성형 AI
Member 심소현   Python Huggingface Pyspark 데이터 분석, 추론, 오픈소스 기여
Member 이수일   Python Pytorch LLM 파인튜닝, MLOps
Member 최성우   Python Huggingface AWS 생성형 AI, 오픈소스 기여
Member 오성민   Python Huggingface 생성형 AI, 오픈소스 기여

🚀 Project Roadmap

gantt
    title 2025 AI 프로젝트 여정
    section 핵심 마일스톤
    프로젝트 기획       :a1, 2025-03-06, 13d
    데이터 구축 & 정제   :a2, after a1, 20d
    모델 학습 & 평가    :a3, after a2, 27d
    모델 개선 & 평가    :a4, after a3, 30d
    section 부가 활동
    수도콘 발표 준비     :2025-4-27, 20d
    수도콘 📢          :2025-5-17, 1d
Loading

🛠️ Our Development Culture

class CollaborationFramework:
    def __init__(self):
        self.tools = {
            'communication': ['Discord', 'Notion'],
            'documentation': 'Notion',
            'version_control': 'GitHub Projects'
        }
    
    def workflow(self):
        return """주간 프로세스:
        1️⃣ 주간 모임 (매주 목요일, 21:00 ~ 22:00)
            - 진행 상황 공유 및 피드백
            - 이번 주 학습 및 실험 결과 논의
            - 세미나와 다음 주 활동 안내
        
        2️⃣ 블로그 아티클 형태로 진행 사항 공유
            - 각자의 실험 및 데이터 구축 경험 정리
            - Hugging Face Hub에 공유할 데이터 및 모델 관련 문서화
            - 핵심 배운 점 및 문제 해결 과정 기록
        
        3️⃣ 주간 코드 리뷰 (GitHub PR)
            - 각자의 데이터셋 구축 및 모델 개발 코드 PR
            - 팀원 간 코드 리뷰 후 Merge 진행
            - 베스트 프랙티스 및 개선 사항 논의
        """

📈 Achievement Metrics

2025 주요 KPI

지표 목표치 현재 달성률
🤗 데이터셋 공개 6건 0%
🤗 파인튜닝 모델 배포 6건 0%
기술 블로그 게시물 24편 0%
기술 세미나 12회 17%

💻 주차별 활동 (Activity History)

날짜 미션 세미나 주제 발표자
2025/03/06 오리엔테이션 김하림
2025/03/13 프로젝트 주제 선정 프로젝트 기획서 작성법 김하림
2025/03/20 데이터 수집 데이터 수집 및 생성 기법 소개 이정진
2025/03/27 ✨ Magical Week ✨
2025/04/03 데이터셋 품질 검증 및 강화 고품질 데이터셋 구축 방법론 심소현
2025/04/10 Hugging Face 데이터셋 카드 작성 Hugging Face 데이터셋 카드 가이드
Hugging Face 모델 허브 탐색법
최성우
2025/04/17 모델 탐색 모델 성능 평가 방법론 이수일
2025/04/24 ✨ Magical Week ✨
2025/05/01 모델 파인 튜닝 및 최적화 효율적인 모델 파인 튜닝 전략 유용상
2025/05/08 프로젝트 중간 점검 및 논의
(성능 분석 및 피드백)
2025/05/15 최종 모델 및 데이터셋 업로드 Hugging Face 모델 카드 작성 가이드
2025/05/17 수도콘 발표
2025/05/22 Hugging Face Space 데모 애플리케이션 구현 Hugging Face Spaces 가이드 정재윤
2025/05/29 가이드북 및 블로그 작성 자유 주제 오성민
2025/06/05 가이드북 및 블로그 작성 자유 주제 김하림
2025/06/12 프로젝트 마무리 및 최종 회고 전체

세미나 주제는 가이드일 뿐, 우리의 여정을 더욱 의미 있게 만들기 위한 출발점입니다.

각 주차의 활동을 탐구하고, 실전에서 바로 적용할 수 있도록 팀원들이 직접 선정한 주제로 인사이트를 나누며 함께 성장해 나갑니다. 🚀

🌿 Our Planted Contributions

  • 링크 (준비중)

💡 Learning Resources

필수자료

참고자료

Hugging Face 공식 자료

자연어처리 및 머신러닝 기초


🌱 How to Engage

✨ 이런 분을 찾고 있어요

Hugging Face Hub Garden 프로젝트는 함께 성장하고, 배우고, 나누는 과정을 중요하게 생각합니다.

우리는 단순한 결과물이 아니라, 과정에서의 협업과 배움을 즐길 수 있는 분을 찾고 있어요.

🔎 이런 경험이 있는 분이라면 더욱 환영해요!
데이터와 AI에 관심이 많아요!

  • 직접 데이터를 수집하거나 정제해본 적이 있어요.
  • 자연어 처리(NLP) 모델을 학습해보거나 사용해본 경험이 있어요.
  • 데이터 기반 프로젝트를 기획하거나 수행해본 적이 있어요.

모델을 만들고 개선하는 게 좋아요!

  • 모델을 직접 파인튜닝하거나 성능을 개선해본 적이 있어요.
  • 새로운 데이터셋을 활용해 모델을 실험해보는 걸 좋아해요.
  • Hugging Face 라이브러리를 활용한 경험이 있거나 배우고 싶어요.

함께 성장하는 문화를 즐겨요!

  • 오픈소스 기여나 커뮤니티 활동에 관심이 있어요.
  • 내 지식을 정리하고 공유하는 걸 좋아해요 (블로그, 세미나, 코드 리뷰 등).
  • 다른 팀원들과 아이디어를 나누고 협업하는 과정에서 즐거움을 느껴요.

도전과 실험을 즐겨요!

  • 새로운 기술을 배우고 실험하는 걸 좋아해요.
  • 처음 해보는 일이어도 적극적으로 도전하고 성장하려는 마음이 있어요.
  • 실패에서 배우는 것을 두려워하지 않고, 함께 해결책을 찾아가는 과정이 재밌어요.

꼭 위 조건을 만족하지 않아도 괜찮아요!

  • Hugging Face를 처음 접하는 분도 환영해요!
  • AI와 데이터 분야에서 첫 프로젝트를 시작하는 분도 함께할 수 있어요.
  • 혼자 하기 어려웠던 프로젝트를 팀과 함께 경험하고 싶은 분이라면 누구나 참여 가능해요!

이 프로젝트에서 함께할 수 있는 것들
✅ 직접 데이터셋을 만들고 모델을 학습하는 경험
✅ 최신 AI 모델을 실험하고 공유하는 과정
✅ 오픈소스 기여 경험 및 커뮤니티에서의 협업
✅ 실전 프로젝트 경험을 통해 실력을 키우고 포트폴리오 강화

우리 함께 Hugging Face Hub Garden에서 만나요 ✨

팀원으로 참여하시려면 러너 모집 기간에 신청해주세요.

누구나 청강을 통해 모임을 참여하실 수 있습니다.

  1. 특별한 신청 없이 정기 모임 시간에 맞추어 디스코드 #Room-AN 채널로 입장
  2. Magical Week 중 행사에 참가
  3. Pseudo Lab 행사에서 만나기

Acknowledgement 🙏

Hugging Face Hub Garden Project is developed as part of Pseudo-Lab's Open Research Initiative. Special thanks to our contributors and the open source community for their valuable insights and contributions.

About Pseudo Lab 👋🏼

Pseudo-Lab is a non-profit organization focused on advancing machine learning and AI technologies. Our core values of Sharing, Motivation, and Collaborative Joy drive us to create impactful open-source projects. With over 5k+ researchers, we are committed to advancing machine learning and AI technologies.

Contributors 😃



License 🗞

This project is licensed under the MIT License.

About

데이터와 모델로 채우는 모두를 위한 AI 허브 가든

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published