Skip to content

Latest commit

 

History

History
61 lines (41 loc) · 2.51 KB

README.md

File metadata and controls

61 lines (41 loc) · 2.51 KB

Author Today Downloader

Использование для Author.Today

Очень примитивная качалка для Author.Today. Пока умеет просто скачивать HTML файлы с картинками.

Для использования требуется установить chromedriver - в зависимости от системы, это может быть просто скачивание .exe файла, или brew cask install chromedriver.

Создайте файл с названием login.properties в корневой директории проекта, с содержимым:

[email protected]
password=your_author_today_password
chromedriver=path to chromedriver
basedir=downloads

Соберите проект командой mvn package

Запускайте командой:

$ java -jar target/at2epub-1.0-SNAPSHOT-jar-with-dependencies.jar \
    https://author.today/reader/60379 result.epub

Поскольку используется Selenium, процесс может быть нестабильным - иногда по каким-то причинам скачивание падает и его приходится перезапускать.

После скачивания будет создан файл result.epub с получившейся книгой.

Использование для Zelluloza

С целлюлозой все к сожалению намного, намного сложнее. Текущий подход для их обычного формата такой:

  1. Делаются скриншоты всех страниц всех фрагментов
  2. Распознавание руками (Tesseract, FineReader, etc)

Для их OCR-proof формата принцип будет такой же, но:

  1. Нужны изменение в коде, потому что "авто-листалка" заточена на обычный формат
  2. Качество будет, увы, низким.

Поэтому пока сосредотачиваемся только на "стандартном" формате.

Разница в формате конфига:

zpassword=your_zelluloza_password

Все остальное идентично (главный класс - Zelluloza), запустить можно:

java -cp target/at2epub-1.0-SNAPSHOT-jar-with-dependencies.jar Zelluloza https://zelluloza.ru/books/10139