上海大学《数据挖掘与知识处理》课程实验参考代码 / Data Mining and Knowledge Processing Experiment Course Reference Code, CES, Shanghai Univ.
本仓库包含数据挖掘与知识处理课程的实验参考代码。这些代码示例旨在帮助学生更好地理解和实践课程中的重要概念。
This repository contains reference code for the Data Mining and Knowledge Processing course labs. These code examples are designed to help students better understand and practice key concepts covered in the course.
-
实验代码示例 / Lab code examples
-
exp01-data-preprocessing: 文本数据预处理与词向量训练实验 / Text Data Preprocessing and Word2Vec Training
- 使用word2vec模型进行词向量训练
- 文本数据预处理流程实现
-
exp02-sentiment-classificationn: 情感分类实验 / Sentiment Classification
- 基于BERT的情感分类模型
- 基于Qwen2.5的情感分类模型
- 包含训练数据集样例
-
exp03-medical-knowledge-graph: 医疗知识图谱构建 / Medical Knowledge Graph Construction
- 实体识别与关系抽取
- Neo4j知识图谱存储
- 包含数据处理和图谱导入脚本
-
exp04-easy-rag-system: 医疗检索增强生成系统 / Medical Retrieval-Augmented Generation System
- 基于 Milvus Lite 的向量数据库存储
- 利用预训练语言模型进行文本嵌入和问答生成
- HTML 文本预处理与分块
- 支持中文医疗问题查询和回答
- 包含完整的 Streamlit 可视化界面
-
数据集样例 / Dataset samples
-
实验指导文档 / Lab guidance documents
- 克隆仓库 / Clone the repository
- 按照实验指导运行相应代码 / Run the code according to lab instructions
- 参考代码仅供学习,请勿直接抄袭 / Reference code is for learning purposes only, do not copy directly
本代码仅供学习参考,请确保理解代码原理后独立完成实验。
This code is for reference only. Please ensure you understand the principles and complete the labs independently.