Skip to content

Ressources from my seminar about DeepSeek-R1: Incentivizing Reasoning Capabilities in LLMs via Reinforcement Learning

Notifications You must be signed in to change notification settings

LukasEEH/seminar-deepseek-r1

Repository files navigation

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Link zum Paper: 2501.12948 (arxiv.org) oder Paper (.pdf)

Link zum Spotlight Talk: Spotlight Talk (.pdf)

Link zur Abschlusspräsentation: Final Presentation (.pdf)


Bei der Recherche wurden unterschiedliche weitere Papers und andere Ressourcen betrachtet. Einige dieser Ressourcen sind bei further-reading gesammelt.

Link zu Further Reading: Further Reading (.md)


Für die Demo wurde Ollama verwendet. Anforderungen und Ablauf sind unter ollama-example Dokumentiert.

Link zu Ollama Example: Ollama Example (.md)

About

Ressources from my seminar about DeepSeek-R1: Incentivizing Reasoning Capabilities in LLMs via Reinforcement Learning

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published