O bate -papo é uma ferramenta simples usada para recuperar mensagens de bate -papo de transmissão ao vivo, vídeos, clipes e transmissões anteriores. Nenhuma autenticação é necessária!
Esta ferramenta é distribuída no Pypi e pode ser instalada com pip :
$ pip install chat-downloader Para atualizar para a versão mais recente, adicione o sinalizador --upgrade ao comando acima.
Como alternativa, a ferramenta pode ser instalada com git :
$ git clone https://github.com/xenova/chat-downloader.git
$ cd chat-downloader
$ python setup.py install usage: chat_downloader [-h] [--version] [--start_time START_TIME]
[--end_time END_TIME]
[--message_types MESSAGE_TYPES | --message_groups MESSAGE_GROUPS]
[--max_attempts MAX_ATTEMPTS]
[--retry_timeout RETRY_TIMEOUT]
[--interruptible_retry [INTERRUPTIBLE_RETRY]]
[--max_messages MAX_MESSAGES]
[--inactivity_timeout INACTIVITY_TIMEOUT]
[--timeout TIMEOUT] [--format FORMAT]
[--format_file FORMAT_FILE] [--chat_type {live,top}]
[--ignore IGNORE]
[--message_receive_timeout MESSAGE_RECEIVE_TIMEOUT]
[--buffer_size BUFFER_SIZE] [--output OUTPUT]
[--overwrite [OVERWRITE]] [--sort_keys [SORT_KEYS]]
[--indent INDENT] [--pause_on_debug | --exit_on_debug]
[--logging {none,debug,info,warning,error,critical} | --testing | --verbose | --quiet]
[--cookies COOKIES] [--proxy PROXY]
urlPor exemplo, para salvar mensagens de uma transmissão ao vivo em um arquivo json, você pode usar:
$ chat_downloader https://www.youtube.com/watch ? v=jfKfPfyJRdk --output chat.jsonPara uma descrição dessas opções, bem como casos e exemplos avançados da linha de comando, consulte a página de uso da linha de comando.
from chat_downloader import ChatDownloader
url = 'https://www.youtube.com/watch?v=jfKfPfyJRdk'
chat = ChatDownloader (). get_chat ( url ) # create a generator
for message in chat : # iterate over messages
chat . print_formatted ( message ) # print the formatted messagePara casos e exemplos avançados de uso do Python, consulte a documentação do Python.
Os itens/mensagens de bate -papo são analisados em objetos JSON (também conhecidos como dicionários) e devem seguir um formato semelhante a este:
{
...
"message_id": "xxxxxxxxxx",
"mensagem": "mensagem real vai aqui",
"message_type": "text_message",
"Timestamp": 1613761152565924,
"time_in_seconds": 1234.56,
"time_text": "20:34",
"Autor": {
"ID": "ucxxxxxxxxxxxxxxxxxxxxxxxx",
"Nome": "Username_of_sender",
"Imagens": [
...
],
"Crachás": [
...
]
},
...
}
Para uma extensa lista documentada de campos incluídos, consulte a página Campos de itens de bate -papo.
Em breve
Encontrou um bug ou tem uma sugestão? Arquivar um problema aqui. Para ajudar os desenvolvedores a corrigir o problema, siga o modelo de problema o mais próximo possível.
Se você deseja ajudar a melhorar a ferramenta, encontrará mais informações sobre como contribuir em nosso guia contribuinte.