Welcome to Hugging Face Hub Garden repository! We aim to cultivate a vibrant AI development community, offering tools and frameworks for dataset creation, model fine-tuning, and knowledge sharing. Join us in advancing the field of Korean language AI through open collaboration and innovation!
Hugging Face Hub Garden 프로젝트는 단순한 데이터셋 구축을 넘어, 자신만의 자원을 만들어 세상과 공유하는 과정을 경험하는 여정입니다.
이 프로젝트에서 우리는 각자의 데이터셋을 설계하고, 최적의 모델을 찾아 파인튜닝하며, Hugging Face Hub에 업로드하는 것을 목표로 합니다. 혼자서는 쉽지 않았던 데이터셋 구축과 모델 최적화를 함께 고민하고, 실험하고, 개선하는 과정을 통해 더욱 깊이 있는 인사이트를 쌓을 수 있습니다.
데이터 수집부터 정제, 다양한 파인튜닝 기법 적용, 성능 평가, 데이터셋 개선까지—전 과정을 직접 경험하고, 단순한 학습을 넘어 창작자로 성장하는 기회가 될 것입니다.
우리 함께 허브 정원을 가꿔볼까요? 🌿✨
Hugging Face KREW는 가짜연구소의 리서치 팀으로, Hugging Face와 관련된 다양한 스터디 및 기여 활동을 진행하는 커뮤니티입니다. 🤗
이번 10기에서는 다음과 같은 프로젝트를 진행합니다.
Hugging Face KREW는 Hugging Face 본사와 직접 소통할 수 있는 핫라인을 보유한 비영리 커뮤니티입니다.저희는 Hugging Face로부터 다양한 지원을 받아 협업을 진행해왔으며, 그 경험을 바탕으로 더 많은 연구자와 개발자가 AI 기술을 활용할 수 있도록 돕고자 합니다.
현재 Hugging Face에서 제공한 크레딧을 활용하여 데이터셋 제작과 파인튜닝을 위한 컴퓨팅 자원을 지원하고 있으며, 추가적으로 GPU 사용을 더욱 원활하게 지원할 계획입니다.
Hugging Face KREW에 대해 더 알고 싶다면 여기에서 확인해보세요! 🚀✨
gantt
title 2025 AI 프로젝트 여정
section 핵심 마일스톤
프로젝트 기획 :a1, 2025-03-06, 13d
데이터 구축 & 정제 :a2, after a1, 20d
모델 학습 & 평가 :a3, after a2, 27d
모델 개선 & 평가 :a4, after a3, 30d
section 부가 활동
수도콘 발표 준비 :2025-4-27, 20d
수도콘 📢 :2025-5-17, 1d
class CollaborationFramework:
def __init__(self):
self.tools = {
'communication': ['Discord', 'Notion'],
'documentation': 'Notion',
'version_control': 'GitHub Projects'
}
def workflow(self):
return """주간 프로세스:
1️⃣ 주간 모임 (매주 목요일, 21:00 ~ 22:00)
- 진행 상황 공유 및 피드백
- 이번 주 학습 및 실험 결과 논의
- 세미나와 다음 주 활동 안내
2️⃣ 블로그 아티클 형태로 진행 사항 공유
- 각자의 실험 및 데이터 구축 경험 정리
- Hugging Face Hub에 공유할 데이터 및 모델 관련 문서화
- 핵심 배운 점 및 문제 해결 과정 기록
3️⃣ 주간 코드 리뷰 (GitHub PR)
- 각자의 데이터셋 구축 및 모델 개발 코드 PR
- 팀원 간 코드 리뷰 후 Merge 진행
- 베스트 프랙티스 및 개선 사항 논의
"""
2025 주요 KPI
지표 | 목표치 | 현재 달성률 |
---|---|---|
🤗 데이터셋 공개 | 6건 | 0% |
🤗 파인튜닝 모델 배포 | 6건 | 0% |
기술 블로그 게시물 | 24편 | 0% |
기술 세미나 | 12회 | 17% |
날짜 | 미션 | 세미나 주제 | 발표자 |
---|---|---|---|
2025/03/06 | 오리엔테이션 | 김하림 | |
2025/03/13 | 프로젝트 주제 선정 | 프로젝트 기획서 작성법 | 김하림 |
2025/03/20 | 데이터 수집 | 데이터 수집 및 생성 기법 소개 | 이정진 |
2025/03/27 | ✨ Magical Week ✨ | ||
2025/04/03 | 데이터셋 품질 검증 및 강화 | 고품질 데이터셋 구축 방법론 | 심소현 |
2025/04/10 | Hugging Face 데이터셋 카드 작성 | Hugging Face 데이터셋 카드 가이드 Hugging Face 모델 허브 탐색법 |
최성우 |
2025/04/17 | 모델 탐색 | 모델 성능 평가 방법론 | 이수일 |
2025/04/24 | ✨ Magical Week ✨ | ||
2025/05/01 | 모델 파인 튜닝 및 최적화 | 효율적인 모델 파인 튜닝 전략 | 유용상 |
2025/05/08 | 프로젝트 중간 점검 및 논의 (성능 분석 및 피드백) |
||
2025/05/15 | 최종 모델 및 데이터셋 업로드 | Hugging Face 모델 카드 작성 가이드 | |
2025/05/17 | 수도콘 발표 | ||
2025/05/22 | Hugging Face Space 데모 애플리케이션 구현 | Hugging Face Spaces 가이드 | 정재윤 |
2025/05/29 | 가이드북 및 블로그 작성 | 자유 주제 | 오성민 |
2025/06/05 | 가이드북 및 블로그 작성 | 자유 주제 | 김하림 |
2025/06/12 | 프로젝트 마무리 및 최종 회고 | 전체 |
세미나 주제는 가이드일 뿐, 우리의 여정을 더욱 의미 있게 만들기 위한 출발점입니다.
각 주차의 활동을 탐구하고, 실전에서 바로 적용할 수 있도록 팀원들이 직접 선정한 주제로 인사이트를 나누며 함께 성장해 나갑니다. 🚀
- 링크 (준비중)
- Hugging Face Hub
- Hugging Face AutoTrain
- Hugging Face Evaluate
- Hugging Face NLP Course - Supervised Fine-Tuning
Hugging Face 공식 자료
- Hugging Face Blog: 최신 연구 및 튜토리얼 공유
- Hugging Face NLP Course: 코드가 포함된 Transforemrs, Datasets, Tokenizers에 대한 무료 강의
- Hugging Face Documentation: Datasets, Model Hub, Trainer API 설명
자연어처리 및 머신러닝 기초
- 딥 러닝을 이용한 자연어 처리 입문: 딥 러닝 자연어 처리 교재 입문서
- Fast.ai NLP Course: 실습 기반의 NLP 입문 강의
- The Illustrated Transformer: Transformer 아키텍처를 직관적으로 설명한 블로그 아티클
Hugging Face Hub Garden 프로젝트는 함께 성장하고, 배우고, 나누는 과정을 중요하게 생각합니다.
우리는 단순한 결과물이 아니라, 과정에서의 협업과 배움을 즐길 수 있는 분을 찾고 있어요.
🔎 이런 경험이 있는 분이라면 더욱 환영해요!
✔ 데이터와 AI에 관심이 많아요!
- 직접 데이터를 수집하거나 정제해본 적이 있어요.
- 자연어 처리(NLP) 모델을 학습해보거나 사용해본 경험이 있어요.
- 데이터 기반 프로젝트를 기획하거나 수행해본 적이 있어요.
✔ 모델을 만들고 개선하는 게 좋아요!
- 모델을 직접 파인튜닝하거나 성능을 개선해본 적이 있어요.
- 새로운 데이터셋을 활용해 모델을 실험해보는 걸 좋아해요.
- Hugging Face 라이브러리를 활용한 경험이 있거나 배우고 싶어요.
✔ 함께 성장하는 문화를 즐겨요!
- 오픈소스 기여나 커뮤니티 활동에 관심이 있어요.
- 내 지식을 정리하고 공유하는 걸 좋아해요 (블로그, 세미나, 코드 리뷰 등).
- 다른 팀원들과 아이디어를 나누고 협업하는 과정에서 즐거움을 느껴요.
✔ 도전과 실험을 즐겨요!
- 새로운 기술을 배우고 실험하는 걸 좋아해요.
- 처음 해보는 일이어도 적극적으로 도전하고 성장하려는 마음이 있어요.
- 실패에서 배우는 것을 두려워하지 않고, 함께 해결책을 찾아가는 과정이 재밌어요.
꼭 위 조건을 만족하지 않아도 괜찮아요!
- Hugging Face를 처음 접하는 분도 환영해요!
- AI와 데이터 분야에서 첫 프로젝트를 시작하는 분도 함께할 수 있어요.
- 혼자 하기 어려웠던 프로젝트를 팀과 함께 경험하고 싶은 분이라면 누구나 참여 가능해요!
이 프로젝트에서 함께할 수 있는 것들
✅ 직접 데이터셋을 만들고 모델을 학습하는 경험
✅ 최신 AI 모델을 실험하고 공유하는 과정
✅ 오픈소스 기여 경험 및 커뮤니티에서의 협업
✅ 실전 프로젝트 경험을 통해 실력을 키우고 포트폴리오 강화
우리 함께 Hugging Face Hub Garden에서 만나요 ✨
- 러너 모집 기간: 2025년 2월 19일 ~ 3월 1일
- 가짜연구소 S10 러너 모집 링크
- 특별한 신청 없이 정기 모임 시간에 맞추어 디스코드 #Room-AN 채널로 입장
- Magical Week 중 행사에 참가
- Pseudo Lab 행사에서 만나기
Hugging Face Hub Garden Project is developed as part of Pseudo-Lab's Open Research Initiative. Special thanks to our contributors and the open source community for their valuable insights and contributions.
Pseudo-Lab is a non-profit organization focused on advancing machine learning and AI technologies. Our core values of Sharing, Motivation, and Collaborative Joy drive us to create impactful open-source projects. With over 5k+ researchers, we are committed to advancing machine learning and AI technologies.
This project is licensed under the MIT License.