TikTok-Scraping

To collect main data and create a collection of publications, use the TikTok Scraping.ipynb file. After that you can go to the py-script VoskSpeechRecognition.py, which will save the recognised text into a table with unique video characteristics.

For speech recognition, you need to download the desired language model from here: https://alphacephei.com/vosk/models (I used the first one, "US English Kaldi ASPIRE model", 1.4 GB). Then create a virtual environment for the project and save there both the model and the py-script for recognition.

Analysis of the results can be done using TikTok Analysis.ipynb file. It is preferable to visualise the results in Cytoscape rather than in Gephi.

Для сбора основных данных и коллекции публикаций нужно работать с файлом TikTok Scraping.ipynb. После этого можно перейти к py-скрипту VoskSpeechRecognition.py, который сохранит в таблицу с уникальными характеристиками видео распознанный текст.

Для распознавания речи нужно скачать модель нужного языка отсюда: https://alphacephei.com/vosk/models (я использовала первую, "US English Kaldi ASPIRE model", 1.4 GB). Затем создайте виртуальное окружение для проекта и сохраните туда и модель, и py-скрипт для распознавания.

Анализ полученных результатов можно провести с помощью файла TikTok Analysis.ipynb. Результаты предпочтительно визуализировать в Cytoscape, а не в Gephi.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
README.md		README.md
TikTok Analysis.ipynb		TikTok Analysis.ipynb
TikTok Scraping.ipynb		TikTok Scraping.ipynb
VoskSpeechRecognition.py		VoskSpeechRecognition.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TikTok-Scraping

About

Releases

Packages

Languages

undine-su-menulio/TikTok-Scraping

Folders and files

Latest commit

History

Repository files navigation

TikTok-Scraping

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages