🔧 Engineed

AI-powered Technical News Aggregator for Japanese Tech Sites

Engineedは日本の主要技術サイト（Qiita、Zenn、はてなブックマーク）から技術記事を自動収集し、AI分析によって整理・分類する技術記事アグリゲーターです。

✨ 主な機能

🕷️ マルチサイトスクレイピング: Qiita、Zenn、はてなブックマークから記事を自動収集
🤖 AI分析: OpenAI GPTによるキーワード抽出と内容分析
🎨 モダンWebUI: レスポンシブデザインの記事表示インターフェース
📊 学習管理: ユーザーの学習進捗と推奨記事機能（設計済み）
🔧 CLI管理: 簡単なコマンドラインインターフェース

🚀 クイックスタート

1. インストール

# リポジトリをクローン
git clone https://github.com/uchan3/engineed.git
cd engineed

# 依存関係をインストール
pip install -r requirements.txt

# パッケージをインストール
pip install -e .

2. 初期設定

# データベースを初期化
python -m engineed.cli init-db

# テストデータを作成（オプション）
python create_test_data.py

3. 記事収集を開始

# 特定のサイトから記事を収集
python -m engineed.cli crawl -s qiita --test
python -m engineed.cli crawl -s zenn --test
python -m engineed.cli crawl -s hateb --test

# または全サイトから収集
python -m engineed.cli crawl --all --test

4. Webインターフェースを起動

# Webサーバーを起動
python -m engineed.cli serve

# ブラウザで http://127.0.0.1:8000 にアクセス

🏗️ プロジェクト構造

engineed/
├── engineed/
│   ├── spiders/          # Scrapyスパイダー
│   │   ├── qiita_spider.py    # Qiita記事収集
│   │   ├── zenn_spider.py     # Zenn記事収集
│   │   └── hateb_spider.py    # はてブ経由記事収集
│   ├── models/           # データベースモデル
│   │   └── database.py        # SQLAlchemyモデル
│   ├── ai/               # AI機能
│   │   └── keyword_extractor.py
│   ├── utils/            # ユーティリティ
│   └── cli.py            # CLIインターフェース
├── web/                  # Webアプリケーション
│   ├── app.py            # FastAPIアプリ
│   ├── templates/        # Jinja2テンプレート
│   └── static/           # CSS/JS/画像
├── tests/                # テストスクリプト
└── docs/                 # ドキュメント

💻 使用技術

バックエンド

Python 3.9+: メイン言語
Scrapy: Webスクレイピングフレームワーク
FastAPI: WebAPIフレームワーク
SQLAlchemy: ORMとデータベース管理
Pydantic: データバリデーション

フロントエンド

Jinja2: テンプレートエンジン
HTML5/CSS3: モダンなWebデザイン
Font Awesome: アイコンライブラリ

AI・機械学習

OpenAI GPT: 記事分析とキーワード抽出
scikit-learn: 機械学習アルゴリズム
transformers: 自然言語処理

データベース

SQLite: 開発・テスト用データベース
PostgreSQL: 本番環境（対応予定）

🔧 設定

環境変数

.env.exampleをコピーして.envを作成し、必要なAPIキーを設定してください：

cp .env.example .env

# OpenAI API設定（必須）
OPENAI_API_KEY=your_openai_api_key_here

# データベース設定（オプション）
DATABASE_URL=sqlite:///data/articles.db

# Webサーバー設定（オプション）
HOST=127.0.0.1
PORT=8000

📚 使用方法

CLIコマンド

# スパイダー一覧表示
scrapy list

# 記事収集（テストモード）
python -m engineed.cli crawl -s qiita --test
python -m engineed.cli crawl -s zenn --test
python -m engineed.cli crawl -s hateb --test

# 全スパイダー実行
python -m engineed.cli crawl --all

# Webサーバー起動
python -m engineed.cli serve --host 0.0.0.0 --port 8000

# システム状態確認
python -m engineed.cli status

Scrapyコマンド（直接実行）

# パイプライン無効でテスト実行
scrapy crawl qiita -s ITEM_PIPELINES="{}" -s CLOSESPIDER_ITEMCOUNT=5

# 本格実行
scrapy crawl qiita
scrapy crawl zenn
scrapy crawl hateb

🧪 テスト

# 全スパイダーの機能テスト
python test_all_spiders.py

# 個別スパイダーテスト
python test_spider.py

# Webアプリテスト
python test_minimal.py

🤝 コントリビューション

このリポジトリをフォーク
フィーチャーブランチを作成 (git checkout -b feature/amazing-feature)
変更をコミット (git commit -m 'Add amazing feature')
ブランチにプッシュ (git push origin feature/amazing-feature)
プルリクエストを作成

📋 今後の計画

本格的なテストスイート（pytest）
検索・フィルタ機能の実装
ユーザー認証・個人設定
AI分析機能の拡張（自動要約、難易度判定）
モバイル対応（PWA）
Docker化とデプロイメント

詳細は改善提案をご覧ください。

📄 ライセンス

This project is licensed under the MIT License - see the LICENSE file for details.

🙋‍♂️ サポート

質問やバグレポートはIssuesにお気軽にお書きください。

Built with ❤️ by Claude Code

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🔧 Engineed

✨ 主な機能

🚀 クイックスタート

1. インストール

2. 初期設定

3. 記事収集を開始

4. Webインターフェースを起動

🏗️ プロジェクト構造

💻 使用技術

バックエンド

フロントエンド

AI・機械学習

データベース

🔧 設定

環境変数

📚 使用方法

CLIコマンド

Scrapyコマンド（直接実行）

🧪 テスト

🤝 コントリビューション

📋 今後の計画

📄 ライセンス

🙋‍♂️ サポート

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
engineed		engineed
web		web
.env.example		.env.example
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
README.md		README.md
USAGE_EXAMPLES.md		USAGE_EXAMPLES.md
create_test_data.py		create_test_data.py
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg
setup.py		setup.py
test_all_spiders.py		test_all_spiders.py
test_minimal.py		test_minimal.py
test_spider.py		test_spider.py

License

uchan3/engineed

Folders and files

Latest commit

History

Repository files navigation

🔧 Engineed

✨ 主な機能

🚀 クイックスタート

1. インストール

2. 初期設定

3. 記事収集を開始

4. Webインターフェースを起動

🏗️ プロジェクト構造

💻 使用技術

バックエンド

フロントエンド

AI・機械学習

データベース

🔧 設定

環境変数

📚 使用方法

CLIコマンド

Scrapyコマンド（直接実行）

🧪 テスト

🤝 コントリビューション

📋 今後の計画

📄 ライセンス

🙋‍♂️ サポート

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages