用基础大模型(base LLM)完成对话-摘要 doc: https://lantu2019.feishu.cn/docx/VwXndRRH6ozVaYxojZKcqgHmnmb
微调基础大模型(base LLM),让TA可以更好的完成对话-摘要 doc: https://lantu2019.feishu.cn/docx/S0IXdgX0foEjuWxpQfFcggf0nBh
通过强化学习微调 FLAN-T5 ,生成更符合人类价值观的摘要 doc: https://lantu2019.feishu.cn/docx/G3N8dcj05oKqkgxQ4Fbcmc9UnBf
从0到1实现一个简单的ReAct Agent doc:https://lantu2019.feishu.cn/docx/DRfrdGG7jozMjTxesc4cIdOvnAe