吉游网提供最新游戏下载和手游攻略!

利用 ChatGPT 批量获取 Lex Fridman 播客字幕

发布时间:2024-10-25浏览:75

之前文章《零代码编程:用ChatGPT下载lexfridman的所有播客音频和文本》已经说明了Lex Fridman播客和字幕的下载方法。另外,这个网站https://karpathy.ai/lexicap/也有lexfridman播客的字幕文件。如何进行批量下载呢?

查看网页源代码,可以看到所有的字幕网页都在div标签中

相关源代码如下:

<div><a href="0001-large.html">1</a> Max Tegmark: Life 3.0 | Lex Fridman Podcast #1</div>

打开后的网页地址是:https://karpathy.ai/lexicap/0018-large.html

因此,在ChatGPT中输入提示词:

你是一个Python编程专家,要完成批量下载网页的任务,具体步骤如下:

打开网站https://karpathy.ai/lexicap/,解析源代码;

定位所有div标签;

在div标签中定位a标签,提取其href值,前面加上:https://karpathy.ai/lexicap/,作为网页的下载地址;

提取div标签内容,然后将其中的特殊符号“:\ / : * ? " < > |,”改成“-”,作为网页的标题名称;

下载网页,保存到D:\lexfridman-podcast

注意:每一步都要输出相关信息

如果网页下载中出现错误,就跳过,继续下载下一个;

源代码:

import os

import requests

from bs4 import BeautifulSoup

def sanitize_filename(s):

"""为文件名清洗特殊字符"""

s = s.replace(":", "-").replace("\\", "-").replace("/", "-")

s = s.replace(":", "-").replace("*", "-").replace("?", "-")

s = s.replace("\"", "-").replace("<", "-").replace(">", "-")

return s.replace("|", "-")

# 打开网站并解析源代码

url = 'https://karpathy.ai/lexicap/'

print(f"访问网站: {url}")

res = requests.get(url)

res.raise_for_status()

soup = BeautifulSoup(res.text, 'html.parser')

# 定位所有div标签

div_tags = soup.find_all('div')

print(f"找到 {len(div_tags)} 个div标签")

# 创建存储文件夹

save_dir = "D:\\lexfridman-podcast"

os.makedirs(save_dir, exist_ok=True)

# 在div标签中定位a标签,提取其href值,前面加上:https://karpathy.ai/lexicap/,作为网页的下载地址;

for div in div_tags:

a_tags = div.find_all('a')

for a in a_tags:

href = a.get('href')

if href:

download_url = 'https://karpathy.ai/lexicap/' + href

# 提取div标签内容,然后将其中的特殊符号“:\ / : * ? " < > |,”改成“-”,作为网页的标题名称;

filename = sanitize_filename(div.text) + '.html'

filename = os.path.join(save_dir, filename)

# 下载网页,保存到D:\\lexfridman-podcast

print(f"下载 {download_url} 到 {filename}")

try:

res = requests.get(download_url)

res.raise_for_status()

with open(filename, 'w', encoding='utf-8') as f:

f.write(res.text)

except Exception as e:

# 如果网页下载中出现错误,就跳过,继续下载下一个;

print(f"下载 {download_url} 时出现错误: {e}")

Continue

所有播客字幕文件下载完成:

用户评论

关于道别

这听起来太酷了!我一直想下载Lex Fridman播客的字幕文本,但手动做太耗时间了。

    有17位网友表示赞同!

别伤我i

零代码编程?我现在就来试试看!我对ChatGPT也很感兴趣。

    有17位网友表示赞同!

折木

批量下载字幕文本这种功能简直神器啊,可以用来学习和研究,效率大幅提升!

    有13位网友表示赞同!

青袂婉约

没想到ChatGPT还能用来做编程,这个应用太新颖了!

    有10位网友表示赞同!

话少情在

这样一来我就不用自己去写代码了,轻松就能完成任务。

    有16位网友表示赞同!

无关风月

对于没有编程经验的人来说,这真是福音啊!

    有6位网友表示赞同!

孤单*无名指

Lex Fridman的播客内容很有深度,有了字幕文本可以更方便地学习和理解。

    有15位网友表示赞同!

别悲哀

这个工具会不会限制了下载的个数或者频率?

    有8位网友表示赞同!

漫长の人生

我很好奇ChatGPT是如何批量下载字幕文本的,算法原理是什么?

    有9位网友表示赞同!

龙卷风卷走爱情

现在还有其他零代码编程平台吗?希望能多了解一下其他应用场景!

    有8位网友表示赞同!

陌然淺笑

学习起来会不会太复杂?需要特别培训吗?

    有9位网友表示赞同!

话扎心

我之前尝试过一些字幕下载网站,但效率都不高。这个工具的性能怎么样吧?

    有16位网友表示赞同!

醉枫染墨

希望以后能支持更多平台的字幕下载,比如YouTube啊什么的。

    有5位网友表示赞同!

陌潇潇

对于专业的研究者来说,这种批量下载功能能大大节省时间和精力。

    有5位网友表示赞同!

麝香味

这款工具是否免费使用呢?如果收费的话,价格怎么样?

    有16位网友表示赞同!

南初

期待这个工具越来越完善,加入更多实用功能!

    有10位网友表示赞同!

站上冰箱当高冷

我觉得这款工具很有潜力,可以帮助更多人轻松利用AI技术。

    有10位网友表示赞同!

罪歌

分享个下载链接吧!我想马上试试看。

    有5位网友表示赞同!

葵雨

看来自己也可以尝试一下零代码编程了,这会是一个很不错的挑战。

    有6位网友表示赞同!

哭花了素颜

希望这个工具能普及化,让科技更加普惠。

    有12位网友表示赞同!

热点资讯