Author Today Downloader

Использование для Author.Today

Очень примитивная качалка для Author.Today. Пока умеет просто скачивать HTML файлы с картинками.

Для использования требуется установить chromedriver - в зависимости от системы, это может быть просто скачивание .exe файла, или brew cask install chromedriver.

Создайте файл с названием login.properties в корневой директории проекта, с содержимым:

login=your_author_today_login@email.com
password=your_author_today_password
chromedriver=path to chromedriver
basedir=downloads

Соберите проект командой mvn package

Запускайте командой:

$ java -jar target/at2epub-1.0-SNAPSHOT-jar-with-dependencies.jar \
    https://author.today/reader/60379 result.epub

Поскольку используется Selenium, процесс может быть нестабильным - иногда по каким-то причинам скачивание падает и его приходится перезапускать.

После скачивания будет создан файл result.epub с получившейся книгой.

Использование для Zelluloza

С целлюлозой все к сожалению намного, намного сложнее. Текущий подход для их обычного формата такой:

Делаются скриншоты всех страниц всех фрагментов
Распознавание руками (Tesseract, FineReader, etc)

Для их OCR-proof формата принцип будет такой же, но:

Нужны изменение в коде, потому что "авто-листалка" заточена на обычный формат
Качество будет, увы, низким.

Поэтому пока сосредотачиваемся только на "стандартном" формате.

Разница в формате конфига:

zpassword=your_zelluloza_password

Все остальное идентично (главный класс - Zelluloza), запустить можно:

java -cp target/at2epub-1.0-SNAPSHOT-jar-with-dependencies.jar Zelluloza https://zelluloza.ru/books/10139

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Author Today Downloader

Использование для Author.Today

Использование для Zelluloza

Files

README.md

Latest commit

History

README.md

File metadata and controls

Author Today Downloader

Использование для Author.Today

Использование для Zelluloza