英语| 中文
此存储库收集与AI相关的实用程序。
所有类别
- 所有类别
- Chatgpt和其他封闭式LLMS
- AI搜索引擎
- 开源LLM
- GPT/LLMS应用程序
- AI图像创建
- LLM提示
- LLM排行榜
- LLM培训平台
- 集成多个LLM的应用程序
- AI代理
- 写作
- 编程开发
- 翻译
- AI对话或AI语音对话
- 语音识别
- 音乐识别
- 文字到语音
- 语音处理
- AI产生的音乐或声音效果
- 语音翻译
- 视频创建
- 视频内容摘要
- OCR(光学特征识别)
Chatgpt和其他封闭式LLMS
| 姓名 | 描述 | 链接 | 费用 |
|---|
| chatgpt | Openai的Chatgpt | URL | 免费/付费 |
| 克劳德 | 人类的AI助手 | URL | 免费/付费 |
| 双子座 | Google的对话,AI聊天服务。 Google的最新LLM,包括Gemini Nono,Gemini Pro和Gemini Ultra。 Gemini Pro可用于API和SDK使用。双子座是从头开始建造的,以进行多模式 - 跨文本,图像,视频,音频和代码无缝推理 | URL 开发:URL | 自由的 |
| Microsoft Copilot | 微软的AI助手。 | URL | 自由的 |
| le聊天 | Mistral.ai的对话,AI聊天服务 | URL | 自由的 |
AI搜索引擎
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 困惑 | AI驱动的对话搜索引擎。 | URL | 自由的 |
| you.com | 在对话模式下的搜索引擎 | URL | 自由的 |
开源LLM
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 骆驼3 | Llama3是Meta AI开发的大型语言模型。它是Meta Llama2语言模型的继任者。 在线测试地址: huggingface.co/meta-llama-3-70b-instruct | github | 自由的 |
| 混音 | Mixtral 8x7b,一种具有开放权重的专家模型(SMOE)的高质量稀疏混合物。在大多数基准测试基准上,Mixtral的表现要超过2 70B,其推断速度更快。它在大多数标准基准上匹配或胜过GPT3.5。 论文:https://arxiv.org/pdf/2401.04088.pdf 新闻:https://mistral.ai/news/mixtral-of-experts/ | 误会 Mistral-Finetune | 自由的 |
| grok-1 | XAI开源的大型语言模型 | github | 自由的 |
| PHI-3 | PHI-3,由Microsoft开发的开放AI模型家族。 PHI-3模型是可用的最有能力,最具成本效益的小语言模型(SLM),在各种语言,推理,编码和数学基准测试中的大小相同和下一个尺寸的模型都优于相同大小的模型。 | github | 自由的 |
GPT LLMS应用程序
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 坡 | Quora制造的AI产品。可以免费使用Chatgpt,Sage,Dragonfly,Claude Bots。您需要的只是一个需要注册的电子邮件地址。 GPT-4每天可以免费使用一次 | URL | 免费,带有付费升级 |
| 拥抱 | 开源代码库为HuggingChat应用程序提供动力。 URL | github | 自由的 |
| 笔记本 | AI研究助理由Google开发。上传PDF,网站,YouTube视频,音频文件,Google Docs或Google Slide,NotebookLM将汇总它们,并在主题之间建立有趣的连接。音频概述功能可以单击一键将您的资源变成引人入胜的“深度潜水”讨论。 | URL | 自由的 |
| 了解 | AI学习助理由Google开发。浏览新主题,并通过适应您独特的好奇心和学习目标的对话学习伴侣来加深您的理解。 | URL | 自由的 |
| 莫妮卡 | AI助手提供了各种任务,例如搜索,阅读,写作,翻译,绘画等。可用的独立应用程序和浏览器插件 | URL 铬扩展 | 免费,带有付费升级 |
| 霍拉马 | 使用Llama 2,Mistral,Gemma和其他大型语言模型开始运行。 | github | 自由的 |
| Openai/Openai-Python | OpenAI API的官方Python图书馆是由OpenAPI规范生成的,不锈钢 | github | 免费,需要Openapi Apikey |
| Sashabaranov/go-openai | 该库为OpenAI API提供了非正式的GO客户。支持:Chatgpt,GPT-3,GPT-4,DALL·E 2 | github | 自由的 |
| Langchain | Langchain是开发由语言模型提供支持的应用程序的框架。 | github | 自由的 |
| Helicone AI | Helicone是用于记录,监视和调试AI应用程序的开源LLM可观察性平台。 | github | 自由的 |
| chatgpt-next-web | 一键单击以获得精心设计的跨平台Chatgpt Web UI,并获得GPT3,GPT4和Gemini Pro支持。 | github | 自由的 |
| 屏幕截图 | 这个简单的应用将屏幕快照转换为HTML/tailwind CSS。它使用GPT-4 Vision生成代码和DALL-E 3来生成相似的图像。现在,您也可以输入URL来克隆实时网站! | github | 免费,需要访问GPT-4 Vision |
| 聊天框 | 使用ChatGpt API(OpenAI API)存储所有聊天消息并在本地提示,从而降低了数据丢失的风险。比Web版本更稳定 | github | 免费,需要Apikey和Openapi |
| GPT-Crawler | 爬网站以生成知识文件以从URL创建您自己的自定义GPT | github | 自由的 |
| chatgpt-shortcut | 开源,ChatGpt快捷方式命令,即通过域和功能划分的双重生产力,可以通过标签,关键字搜索和一键单击副本过滤提示单词。 | github | 自由的 |
| Chatgpt侧边栏 | Chatgpt侧边栏是一个人工智能助理,您可以在浏览任何网站时使用。 | URL | 自由的 |
| webchatgpt | 开源,将网络的能力扩展到chatgpt | github
| 自由的 |
| AIPRM用于chatgpt | 浏览器插件,提供一系列选定的chatgpt指令模板,甚至创建自己的AI音调和写作风格 | URL | 自由的 |
| gptcache | ⚡GPTCACHE是一个用于创建语义缓存以存储LLM查询响应的库。它可用于加快依靠LLM服务的聊天应用程序的成本加快和降低。在AIGC方案中,它类似于Redis。 | github
| 自由的 |
| Mindmac | 功能丰富和隐私 - 首先使用的本机Chatgpt应用程序用于Macos,用于使用OpenAi,Azure Openai,人类Claude,OpenRouter,全部旨在最大程度地生产率。目前有15种语言可用。 | URL | 免费,带有付费升级 |
| 备忘录 | 开源混合AI搜索引擎,立即从Internet,书签,笔记和文档中获得准确的答案。支持一单击部署。 | github
| 免费&Suport一键式自助主机 |
AI图像创建
| 姓名 | 描述 | 链接 | 费用 |
|---|
| Midjourney | 输入文本或图片创建图片 | URL | 免费帐户具有一定的用法分钟限制,并且有付费升级版本 |
| Photoshop AI | Adobe Photoshop生成填充 | URL | 有薪酬的 |
| 稳定的扩散WebUI | 开源项目,输入文本或图片以创建图片,稳定的扩散WebUI是稳定扩散的GUI,它是一个可视化稳定扩散的图像用户界面。它还集成了许多其他有用的扩展脚本。 | github
| 自由的 |
| Civitai | civitai.com是一个网站平台,用于共享具有大量型号的AI图像创建模型资源,已成为SD开源社区中的主要模型交换场所 | URL | 自由的 |
| 夹具 | 稳定性的夹具。具有许多AI图像处理工具,例如稳定的扩散XL,Uncrop,Reimage XL,稳定的Doodle。 | URL | 免费/付费 |
| 萤火虫 | Adobe的AI图像处理网站 | URL | 免费/付费 |
| 意识形态图 | 输入文本以创建图片。由许多前山羊者创立的公司开发的产品 | URL | 免费/付费 |
| Skybox AI | 使用文本提示生成360度全景图像 | URL | 免费/付费 |
| 德拉格 | 对生成图像歧管的基于交互点的操作 | github
| 自由的 |
| Visual-Chatgpt | 用chatgpt创建图像 | github
| 自由的 |
| Microsoft Bing图像创建者 | 图像创建者是使用DALL-E技术创建图片的工具。尝试生成肖像图片难看 | URL | 自由的 |
| 删除 | 删除图像背景 | URL | 免费/付费 |
| 控制网 | 控制网是通过添加额外条件来控制扩散模型的神经网络结构。 | github | 自由的 |
| 溪流 | 实时交互生成的管道级解决方案 | github | 自由的 |
LLM提示
| 姓名 | 描述 | 链接 | 费用 |
|---|
| f/很棒的chatgpt-prompts | 此存储库包括Chatgpt提示策划,以更好地使用ChatGpt。 | github | 自由的 |
LLM排行榜
| 姓名 | 描述 | 链接 | 费用 |
|---|
| LMSYS聊天机器人竞技场排行榜 | LMSYS Chatbot Arena是LLM Evals的众包开放平台。通过Bradley-Terry模型对LLM进行了1,000,000多个人的成对比较,并在ELO级显示模型评分。 | URL | 自由的 |
| 人工分析 | 人工分析是一个平台,可提供AI模型和服务提供商的比较和基准测试,以帮助用户在选择AI模型和服务提供商时做出明智的决策。该平台提供了有关广泛流行的AI模型的比较数据,包括OpenAI的GPT-4,Meta的Llama 3和Anthropic的Claude系列,涵盖了诸如响应时间,延迟和成本等性能指标。 | URL | 自由的 |
LLM培训平台
| 姓名 | 描述 | 链接 | 费用 |
|---|
| LM-SYS/FastChat | 一个开放的平台,用于培训,服务和评估大型语言模型。 Vicuna和Chatbot Arena的发行回购。 | github | 自由的 |
集成多个LLM的应用程序
| 姓名 | 描述 | 链接 | 费用 |
|---|
| Chathub | 在一个应用程序中使用不同的聊天机器人,目前支持Chatgpt,New Bing Chat,Google Bard,Claude和10多个开源型号,包括羊驼,Vicuna,Chatglm等。 | github
| 免费/付费 |
| CHATALL | 同时与Chatgpt,Bing Chat,Bard,羊驼,Vicuna,Claude,Chatglm,Moss等聊天,发现最佳答案 | github
| 自由的 |
| 港口 | 毫不费力地使用一个命令运行LLM后端,API,前端和服务。 | github
| 自由的 |
AI代理
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 自动gpt | 开源,这是一种实验性开源,试图使GPT-4完全自主。 | github
| 自由的 |
| 其他派/自我操作计算机 | 一个框架,以使多模型能够操作计算机。 | github | 免费,需要GPT-4V |
| 泡沫 | 多模式代理作为智能手机用户,这是一种旨在操作智能手机应用的多模式代理框架。 | github | 自由的 |
| Microsoft/Autogen | Autogen是一个开源编程框架,用于构建AI代理商并促进多个代理之间的合作来解决任务。 | github | 自由的 |
| potpie-ai/potpie | 代码库的开源AI代理。使用预先建造的代理进行问答,测试,调试和系统设计或创建自己的专用代理。 | url,github | 免费试用 |
写作
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 概念ai | AI辅助笔记软件 | URL | 通过某些免费的AI试验,AI每月提供10美元 |
| 深度写 | 英语和德语写作工具来修复写作错误并及时重写句子。 | URL | 免费版本可与文字限制 /付费升级一起使用 |
| 语法 | 与您的个人写作助理,语法检查器和编辑编辑并纠正您的语法,拼写,标点符号等等。 | URL | 免费/付费 |
编程开发
| 姓名 | 描述 | 链接 | 费用 |
|---|
| github副标士 | Github和Openai开发的代码写作助理 | URL | 有薪酬的 |
| 光标 | 使用GPT的协作代码编辑器 | URL | 付费/免费试用 |
| Marscode | 内置的AI编程助理助理具有代码完成,解释和调试诸如更快开发的功能。 | URL | 自由的 |
| AI-Code-Translator | 开源项目。使用chatgpt将代码从一种语言转换为另一种语言。 | github
| 免费,需要OpenAI API密钥 |
| Amazon Codewhisperer | 亚马逊开发的代码写作助理 | URL | 免费使用 |
| GPT工程师 | GPT工程师很容易适应,扩展和使您的代理商学习您的代码外观。它根据提示生成整个代码库。 | github | 自由的 |
| 法典 | 强大的IN-IN-IN IN编码助手 | URL | 免费/付费 |
| 鳞片 | Scalene:具有AI驱动的优化建议的高性能,高精度CPU,GPU和内存分析器 | github
| 自由的 |
| fitten代码 | Fitten Code是由Fitten LLM型号驱动的AI编程助理,可以自动生成代码,提高开发效率,帮助您调试并节省时间。它还可以与您聊天并解决您的编程问题。FreeAnd支持80多种语言:Python,C ++,JavaScript,Typescript,Java等。FittenCode支持Visual Studio Code和Jetbrains Series IDES,包括Intellij Ideas,Pycharm,WebStorm,WebStorm等。 | URL | 自由的 |
| 蓬勃发展 | 适用于生产的LLM代理SDK适用于每个开发人员 | github | 自由的 |
| Plandex | 开源,基于终端的AI编程引擎,用于复杂任务 | github | 自由的 |
| Mistral/Codestral | 授权开发人员和通过Mistral AI。,模型进行民主化编码:https://huggingface.co/mistralai/codestral-22b-v0.1 | URL | 自由的 |
翻译
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 沉浸式翻译 | 开源项目。沉浸双语的网络翻译扩展 | github
| 自由的 |
| 深l | 准确而即时的翻译工具,目前支持31种语言 | URL | 免费/付费 |
| Openai Translator | 开源项目。基于ChatGpt API | github
| 免费,需要OpenAI API密钥 |
AI对话或AI语音对话
| 姓名 | 描述 | 链接 | 费用 |
|---|
| pi.ai | 被证明擅长聊天的AI,因此您不必整天担心。它支持文本和语音。 Apple的输入系统需要语音输入。非常适合练习英语对话和聆听。 | URL | 自由的 |
| CHATGPT的语音控制 | 此Chrome扩展程序使您可以与Chatgpt进行语音对话。 | URL | 免费,需要chatgpt帐户 |
| 演讲示意 | SpeechGpt是一个Web应用程序,使您能够与ChatGpt交谈。 | github
| 免费,需要OpenAI API密钥 |
语音识别
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 耳语 | OpenAPI开源强大的语音识别模型通过大规模的弱监督 | github
| 自由的 |
| 嗡嗡声 | 基于Openai的耳语以识别语音并产生字幕的开源桌面软件 | github
| 自由的 |
| hisperdesktop | 开源,基于OpenAi的Whisper是Windows的桌面应用程序,它使用GPU进行处理,它的速度比在CPU上的GPU性能均快。 | github | 自由的 |
| 耳语 | Whisperx:具有单词级时间戳(&诊断)的自动语音识别 | 耳语 | 自由的 |
| 窃窃私语 | 直接在您的浏览器中直接以ML为动力的语音识别。由变形金刚构建。演示 | github | 自由的 |
文字到语音
| 姓名 | 描述 | 链接 | 费用 |
|---|
| Azure文字到语音 | 目前可用的最好,最现实的语音工具 | URL | 每月免费付费 / 500,000个字符 |
| coqui-ai/tts | 用于文本到语音的深度学习工具包,在研究和生产中进行战斗测试 在线演示:https://huggingface.co/spaces/coqui/xtts | github | 自由的 |
| Elevenlabs | 智能的AI文字到语音 | URL | 免费/付费 |
| netease-youdao/情感 | 多功能和及时控制的TTS引擎。 Emotivoice会说英语和中文,以及超过2000种不同的声音。最突出的特征是情感综合,使您能够以各种各样的情感(包括快乐,兴奋,悲伤,愤怒和他人)创作演讲。 | github | 自由的 |
| tetos | 多个文本到语音(TTS)提供商的统一界面。支持的TTS提供商:Edge TTS,OpenAI TTS,Azure TTS,Google TTS,Volcengine TTS,Baidu TTS | github | 自由的 |
| 查特 | Chattts是一种专门针对对话场景(例如LLM Assistant)设计的文本到语音模型。它支持英语和中文。我们的模型经过100,000多个小时的培训,由中文和英语组成。网站:https://chattts.com/ | github | 自由的 |
音乐识别
| 姓名 | 描述 | 链接 | 费用 |
|---|
| Shazam | 下载用于音乐识别的Shazaom应用程序,这非常快 | URL | 自由的 |
语音处理
| 姓名 | 描述 | 链接 | 费用 |
|---|
| SO-Vits-SVC | SOFTVC VITS歌声转换。 | github | 自由的 |
| 人声 | 提取声音和音乐 | URL | 自由的 |
| lala.ai | 从任何音频和视频中提取声音,伴奏和各种乐器 | URL | 免费/付费 |
AI产生的音乐或声音效果
| 姓名 | 描述 | 关联 | 费用 |
|---|
| suno.ai | AI音乐创建工具Suno可以在仅此的文本提示中生成自定义歌曲 | URL | |
| udio | 通过指定主题,流派和其他描述符来从简单文本提示中创建音乐,然后将其转换为专业质量曲目。 | URL | |
| Elevenlabs/声音效应 | 想象一下声音并将其栩栩如生,或探索社区产生的最佳声音效果。 | URL | 自由的 |
| Suno-ai/树皮 | Bark是由Suno创建的基于变压器的文本对ADIO模型。树皮可以产生高度逼真的,多语言的语音以及其他音频 - 包括音乐,背景噪音和简单的声音效果。 | github | 自由的 |
| 听众 | Meta的音频/音乐生成的开源库,其中主要包括两种模型:MusicGen:文本到音乐模型,Audiogen:文本生成的声音模型。 Musicgen Online演示 | github
| 自由的 |
| 稳定的音频 | AI音乐和声音效果生成稳定性的应用。 | URL | 免费/付费 |
| Optimizerai | 声音效果产生 官方介绍 | URL | 免费/付费 |
| SFX引擎 | AI音效产生 | URL | 免费/付费 |
语音翻译
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 无缝的 | 无缝是一个AI模型的家族,可以跨语言进行更自然和真实的沟通。 | github | 自由的 |
视频创建
| 姓名 | 描述 | 链接 | 费用 |
|---|
| 克林·艾伊 | Kuaishou的AI视频创建工具。 | URL | 免费/付费 |
| 梦想机器 | 由Luma ai。 Dream Machine是一种AI型号 | URL | 免费/付费 |
| 索拉 | Sora是由OpenAI发表的AI模型,可以从文本说明中创建现实而富有想象力的场景。 Sora Access尚未完全开放,一些视觉艺术家,设计师和电影制片人可以访问 | URL | - |
| 盖 | 字幕生成的语音,语音识别以及非常方便且功能强大的视频编辑 | URL | 免费/付费 |
| 跑道 | gen-2:视频的文字/图像 gen-1:视频到视频。特色视频:https://runwayml.com/staff-picks | URL | 付费/免费试用 |
| 皮卡 | 文字/图像到视频 | URL | 付费/免费试用 |
| 弗利 | 将文本转换为音频和视频的网站 | URL | 免费/付费 |
| 做过 | 基于文本生成数字人类配音视频 | URL | 付费/免费试用 |
| 海根 | 基于文本生成数字人类配音视频 | URL | 付费/免费试用 |
| Animatediff | Animatediff是一个插件模块,将大多数社区模型转换为动画发生器,而无需额外的培训。 | github | 自由的 |
| vivago.ai/video | 视频的文字;图像到视频; 4K增强 | URL | 自由的 |
视频内容摘要
| 姓名 | 描述 | 链接 | 费用 |
|---|
| YouTube的CHATGPT | Chrome插件,快速总结YouTube视频内容,需要登录Chatgpt帐户或Apikey | URL | 自由的 |
| 聊天YouTube | 给出YouTube链接,将提供摘要,您可以询问有关视频内容的问题 | URL | 自由的 |
OCR
| 姓名 | 描述 | 链接 | 费用 |
|---|
| UMI-OR | 带有高效的离线OCR引擎。只要计算机的性能就足够了,它就可以比在线OCR服务更快。 | github | 自由的 |
Awesome-aitools Discord链接:https://discord.gg/7havjqme