DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Link zum Paper: 2501.12948 (arxiv.org) oder Paper (.pdf)

Link zum Spotlight Talk: Spotlight Talk (.pdf)

Link zur Abschlusspräsentation: Final Presentation (.pdf)

Bei der Recherche wurden unterschiedliche weitere Papers und andere Ressourcen betrachtet. Einige dieser Ressourcen sind bei further-reading gesammelt.

Link zu Further Reading: Further Reading (.md)

Für die Demo wurde Ollama verwendet. Anforderungen und Ablauf sind unter ollama-example Dokumentiert.

Link zu Ollama Example: Ollama Example (.md)

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
DeepSeek-R1_Incentivizing_Reasoning_Capability_in_LLMs_via_Reinforcement_Learning.pdf		DeepSeek-R1_Incentivizing_Reasoning_Capability_in_LLMs_via_Reinforcement_Learning.pdf
README.md		README.md
deepseek-r1-final.pdf		deepseek-r1-final.pdf
further-reading.md		further-reading.md
ollama-example.md		ollama-example.md
spotlight-talk.pdf		spotlight-talk.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

About

Uh oh!

Releases

Packages

LukasEEH/seminar-deepseek-r1

Folders and files

Latest commit

History

Repository files navigation

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Packages