Video Face Swap
Video Face Swap 是一款完全免费的 AI 换脸工具,用户可以在任何视频中轻松替换人脸。该工具支持实时或后期处理换脸,适用于视频、照片和 GIF 动画。其智能算法能够识别视频中的面部并进行精确替换,生成逼真且有...
Codeium(Windsurf Editor):免费的AI代码补全与聊天工具,Windsurf以对话方式编写完整项目代码
Codeium是一款免费的AI代码补全与聊天工具,旨在提升开发者的编程效率。它支持超过70种编程语言,并与40多种集成开发环境(IDE)兼容。Codeium不仅提供代码自动补全功能,还具备代码生成、代码解释和聊天功能,帮...
Cursor试用期重置工具:解决Cursor试用期限制问题,轻松重置试用期,避免升级到专业版
Cursor Free Trial Reset Tool 是一个开源工具,旨在解决Cursor在免费订阅期间出现的多账户限制问题。当用户在同一台机器上使用多个免费试用账户时,Cursor会提示“Too many free trial acc...
PocketPal AI
PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用。它提供了一种不依赖网络的AI聊天体验,确保用户隐...
Jan:开源离线AI助手,ChatGPT 替代品,运行本地AI模型或连接云端AI
Jan 是一个开源的 ChatGPT 替代品,能够在用户的设备上 100% 离线运行。它由 Cortex 引擎驱动,支持多种硬件平台,包括 NVIDIA GPU 和 Apple M 系列芯片。Jan 提供了丰富的模型库,用户可以下载并运行如...
Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手
Roo Code(前称Roo Cline)Roo Code(Roo Cline) 是一个基于 Cline 的增强版自主编程助手,它是一个强大的 VS Code 扩展插件。这个工具能够在您的集成开发环境(IDE)中实现自主编码,具备创建和编辑...
PolyBuzz:与AI角色互动的免费聊天与角色扮演平台
PolyBuzz 是一个免费的 AI 聊天和角色扮演平台。用户可以与超过 2000 万个虚拟角色互动。这些角色涵盖动漫、电影、游戏和历史人物等多个领域。平台支持用户创建自定义角色,设计个性化的外观和背景故事。它提供自...
Unlimited AI Chat:免费无限制的AI聊天工具
Unlimited AI Chat 是一个免费的在线AI聊天平台,用户无需注册即可使用。它支持无限制的内容生成,包括创意写作、虚构故事,甚至NSFW(不适合工作环境)内容。平台采用先进的自然语言处理技术,生成接近人类对话...
Polyglotta:多语言翻译与学习工具
Polyglotta 是一个专为语言爱好者和学习者设计的多语言翻译工具。它不仅提供单词或短语在多种语言中的翻译,还能展示不同语言间意义的细微变化。用户可以比较同一单词在多文化背景下的表达,深入了解语言的多样性...
KunAvatar(kun-lab):基于 Ollama 的本地轻量AI对话客户端
kun-lab 是一款基于 Ollama 的开源 AI 对话应用,专注于提供轻量、快速的本地化智能对话体验。它支持 Windows、macOS 和 Linux(目前以 Windows 为主),无需复杂配置即可使用。用户可以与 AI 进行流畅...
Video Face Swap
Video Face Swap 是一款完全免费的 AI 换脸工具,用户可以在任何视频中轻松替换人脸。该工具支持实时或后期处理换脸,适用于视频、照片和 GIF 动画。其智能算法能够识别视频中的面部并进行精确替换,生成逼真且有...
Qwen Code:基于 Gemini CLI 的命令行工具助力代码生成与管理
Qwen Code 是一个开源命令行工具,基于 Google 的 Gemini CLI 开发,专为 Alibaba Cloud 的 Qwen3-Coder 模型优化。它帮助开发者通过命令行完成代码生成、编辑和仓库管理任务。qwen-code...
Jan:开源离线AI助手,ChatGPT 替代品,运行本地AI模型或连接云端AI
Jan 是一个开源的 ChatGPT 替代品,能够在用户的设备上 100% 离线运行。它由 Cortex 引擎驱动,支持多种硬件平台,包括 NVIDIA GPU 和 Apple M 系列芯片。Jan 提供了丰富的模型库,用户可以下载并运行如...
Video Face Swap
Video Face Swap 是一款完全免费的 AI 换脸工具,用户可以在任何视频中轻松替换人脸。该工具支持实时或后期处理换脸,适用于视频、照片和 GIF 动画。其智能算法能够识别视频中的面部并进行精确替换,生成逼真且有...
AI Face Swap:免费AI人脸替换、视频换脸、多人换脸工具
AI Face Swap 是一个免费的在线平台,利用人工智能技术让用户轻松实现照片、视频和GIF中的人脸替换。无需下载软件或注册账号,用户只需上传文件即可快速完成操作。网站支持多种格式,如JPG、PNG、MP4和GIF,输出...
AdpexAI:生成式AI图像、视频内容创作平台
AdpexAI 是一个集生成式AI工具于一体的在线平台,提供图像编辑、视频编辑、AI聊天和代码生成等功能。用户无需安装软件,通过浏览器即可快速创建高质量视觉内容、编写代码或与智能AI模型互动。平台支持多种尖端AI...
Vheer:免费不限量生成AI图像和视频的在线工具
Vheer 是一个免费的在线 AI 图像生成和编辑平台,适合创作者、设计师和普通用户。用户通过输入文本描述或上传图片,即可快速生成高质量图像,无需注册或付费。平台提供文本转图像、图像风格转换、背景移除、图像...
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具
Vidnoz是一款免费的AI视频生成平台,可在1分钟内快速创建AI视频。不需要成本、下载和经验。平台提供500+ AI虚拟人物,470+逼真AI配音以及500+模板。通过Vidnoz AI视频生成器,用户可以更快地创建视频,从而提高投...
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品
Whisk是Google Labs推出的一款创新型AI图像生成工具,旨在通过上传多张图片来混合不同的主题、场景和风格。与传统的依赖文本提示的图像生成工具不同,Whisk主要使用图像作为输入,让用户能够更直观地创作艺术作品...
通义听悟:阿里通义音视频内容转录AI助手
通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的转写和分析。它依托阿里云的强大AI模型,能够将音视频内容实时转写成文字,并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景,帮助用户...
SkyReels:AI视频短剧创作平台,擅长生成动作自然的全景人像
SkyReels 是一个专注于 AI 视频创作的在线平台,旨在帮助用户快速将文本脚本或创意想法转化为高质量短视频。无论你是内容创作者、营销人员还是普通用户,只需输入文字,平台就能自动生成带有逼真语音、精准字幕和...
Google AI Studio:体验与集成Google Gemini最新模型,构建多模态生成模型
Google AI Studio 是一个由 Google 提供的平台,旨在帮助开发者快速集成和使用最新的多模态生成 AI 模型。通过获取 Gemini API 密钥,用户可以在不到五分钟的时间内将强大的 AI 能力集成到他们的应用程序中。该...
Repo Prompt:依赖本地文件夹上下文进行写作、对话与优化代码
Repo Prompt是一款专为macOS平台打造的原生应用程序,致力于简化开发者使用先进AI语言模型处理本地代码的流程。该工具通过智能化的方式帮助开发者管理和修改代码文件,显著提升开发效率。其核心优势在于为开发者...
Internet.io:聚合多AI模型答案的智能工作平台
Internet.io 是一个聚合多个顶级 AI 模型答案的智能平台。旨在解决单一 AI 答案可能不准确或不一致的问题。用户只需提出一个问题,就能同时获得多个领先 AI 模型的回答,方便对比和选择最可靠的答案。平台还提供...
置顶Had No Idea:快速生成并验证创业想法的AI工具
Had No Idea 是一个帮助用户快速生成、验证和启动创业项目的免费AI工具。它针对没有明确创业方向的用户,10分钟内从零开始生成个性化创业想法,验证市场可行性,创建品牌形象,并生成可直接用于开发的蓝图。工具...
置顶Internet.io:聚合多AI模型答案的智能工作平台
Internet.io 是一个聚合多个顶级 AI 模型答案的智能平台。旨在解决单一 AI 答案可能不准确或不一致的问题。用户只需提出一个问题,就能同时获得多个领先 AI 模型的回答,方便对比和选择最可靠的答案。平台还提供...
置顶Sigma AI Browser:免费使用主流大模型的AI浏览器
Sigma AI Browser是一款由SigmaBrowser OÜ开发的先进浏览器,利用人工智能技术为用户提供更快、更智能的浏览体验。该浏览器不仅注重速度和效率,还提供了增强的安全性和个性化推荐功能,确保用户在浏览网页时获得...
置顶Page Assist:本地AI模型对话与检索文档的网页助手插件
Page Assist 是一个开源的浏览器扩展,旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展,用户可以在任何网页上打开一个侧边栏,与本地运行的AI模型进行互动。Page Assist 支持多种浏览器,包括Chrome、B...
PocketPal AI
PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用。它提供了一种不依赖网络的AI聊天体验,确保用户隐...
Jan:开源离线AI助手,ChatGPT 替代品,运行本地AI模型或连接云端AI
Jan 是一个开源的 ChatGPT 替代品,能够在用户的设备上 100% 离线运行。它由 Cortex 引擎驱动,支持多种硬件平台,包括 NVIDIA GPU 和 Apple M 系列芯片。Jan 提供了丰富的模型库,用户可以下载并运行如...
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端
Cherry Studio 是一款支持多种大语言模型(LLM)服务的桌面客户端,兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计,帮助用户在多种场景下提升工作效率。用户可以通过 Cherry St...
豆包
豆包综合介绍 豆包是由抖音旗下子公司开发的人工智能AI助手,国内版使用最新的云雀大模型。它是一款能够帮助用户解决问题、获取信息和提高效率的智能助手工具。豆包支持中英文,可以联网使用,并提供网页版、安卓...
Monica AI(莫妮卡): 全功能的综合AI助手,全终端支持的AI助手
推荐在Chrome或Edge中使用 Monica AI 浏览器插件版(海外文明上网版) Monica(莫妮卡)开启国内域名,对比海外收费模式,国内版免费使用! Monica介绍 Monica(莫妮卡)是一款全功能...
Kimi
Kimi Chat是由月之暗面(Moonshot AI)研发的智能助手,能够处理长达20万汉字的文本。Kimi拥有超大“内存”,可以快速阅读文档及上网搜索信息,为用户提供高效的信息处理和互动体验。其突破性的长文本处理能力在同类...
OpenRouter:集成多LLMs的统一接口,免费大模型接口
OpenRouter是一个大模型API聚合平台,提供了让用户可以方便地接入和使用多种大型语言模型的能力。用户可以比较不同模型和价格,为自己的情景需求找到最合适的解决方案。OpenRouter支持包括OpenAI的GPT-4、Claude ....
CopyCoder:根据UI截图生成AI编码提示指令,AI IDE辅助工具,生成构建应用的提示词
CopyCoder是一款创新的AI驱动工具,专为下一代AI编码人员设计。它能够从应用程序界面、UI模型或自定义设计的图像中生成编码提示,帮助开发者更快地构建应用。通过将视觉设计转化为代码,CopyCoder大大提高了编程效率...
置顶Vheer:免费不限量生成AI图像和视频的在线工具
Vheer 是一个免费的在线 AI 图像生成和编辑平台,适合创作者、设计师和普通用户。用户通过输入文本描述或上传图片,即可快速生成高质量图像,无需注册或付费。平台提供文本转图像、图像风格转换、背景移除、图像...
置顶Lovart:将文字提示转化为专业设计的AI工具
Lovart 是一个创新的AI设计平台,通过自然语言输入将用户的创意想法转化为专业级视觉设计。用户只需用简单文字描述需求,Lovart 就能生成海报、品牌标识、视频和3D内容等多种设计资产。该平台整合了多种AI模型,...
置顶Artbreeder:超强图像控制与图像风格混合工具,适合教学使用
Artbreeder 是一个基于人工智能(AI)的协作艺术创作网站。它利用StyleGAN和BigGAN模型帮助用户生成和修改人脸、风景、绘画等图像。通过“基因”滑块操作,用户能够创造出新的变体,或者交配图片产生新的影响因子。...
置顶OpenCreator:整合多种AI模型生成创意视频
OpenCreator 是一个在线工具,专为创作者设计,核心功能是把20多种生成式AI模型整合在一起。用户可以用它轻松生成创意视频,无需在不同平台间切换或支付多份订阅费。它界面简单,支持一键比较不同模型效果,按使...
MagicQuill:智能交互式图像涂鸦编辑系统,精准局部涂鸦编辑
MagicQuill是一个由香港科技大学、蚂蚁集团、浙江大学和香港大学共同推出的开源AI互动式图像编辑工具。该工具旨在通过智能化和互动式的方式,实现对图像的精准局部编辑。MagicQuill提供了用户友好的界面和AI驱动...
Raphael:免费无限制的使用 FLUX.1-Dev 生成图像
Raphael 是世界上第一个完全免费且无限制的 AI 图像生成器,由 FLUX.1-Dev 模型提供支持。用户可以通过文本描述生成高质量的图像,无需注册或任何使用限制。Raphael 提供卓越的图像质量、快速的生成速度和完整的...
Remaker:免费在线换脸工具
Remaker AI 是一个利用最新人工智能技术开发的创新工具集,支持创建和生成各种类型的内容,包括文本、图像、语音等。用户可以通过该平台进行照片和视频的面部交换、生成AI肖像、图像放大、制作会说话的照片等。Re...
即梦AI
即梦AI是一个一站式的AI创作平台,旨在为用户提供多功能且强大的创作工具。无论是图像生成、智能画布、视频生成还是音乐生成,即梦AI都能帮助用户轻松实现创意。平台支持多种创作模式,包括AI作图、AI视频、AI音...
星流
星流(Xingliu)是由LiblibAI团队开发的一款新一代AI图像创作工具,它基于自研的 Star-3 Alpha 图像生成模型,能够提供高精度、多样化的图像生成服务。旨在为设计师、摄影师和影像创作者提供强大的生产力支持。该...
可灵 AI:快手推出的生成创意图片和视频的AI工具
可灵 AI(Kling AI)是快手推出的一款新一代AI创意生产力平台,旨在通过先进的生成式AI技术,帮助用户轻松创建高质量的图片和视频内容。平台基于快手自研的可图大模型和可灵大模型(Kolors),提供了强大的图像和...
SeaArt 海艺AI:简单易上手的AI绘画创意平台
SeaArt是一款用户友好、高效的AI绘图工具。其强大的渲染引擎、个性化的混合推荐系统、涵盖动漫、3D、数码艺术、油画等多种风格的庞大模型库,提供200,000+模型和风格,让用户创造艺术、插画等作品。它包括AI面部...
LiblibAI·哩布哩布:在线免费使用Stable Diffusion,每日免费生成200张图片
LiblibAI 综合介绍 LiblibAI是一个中国领先的AI图像创作平台,拥有丰富的AI创作工具和资源。用户可以在这个平台找到超过10万个免费的AI创作模型,用于图片、文字、音频等素材的创作。LiblibAI鼓励原创,提....
置顶Wan:基于Wan系列模型的视频和图像生成工具
Wan是一个AI驱动的视觉内容生成网站,其核心是名为Wan 2.2的开源模型。用户可以通过这个工具,将文字、图片或音频快速转换成高质量的视频。网站支持多种生成方式,包括“文字生成视频”、“图片生成视频”以及独特的“...
置顶Animon:免费生成动漫风格短视频的AI工具
Animon 是一个专注于动漫风格视频生成的 AI 平台,由日本公司 Animon Dream Factory 开发。它通过上传静态动漫或漫画风格图像,配合简单的文字描述,快速生成 5 秒左右的动画视频。平台操作简单,适合初学者和专...
置顶Vheer:免费不限量生成AI图像和视频的在线工具
Vheer 是一个免费的在线 AI 图像生成和编辑平台,适合创作者、设计师和普通用户。用户通过输入文本描述或上传图片,即可快速生成高质量图像,无需注册或付费。平台提供文本转图像、图像风格转换、背景移除、图像...
置顶Lovart:将文字提示转化为专业设计的AI工具
Lovart 是一个创新的AI设计平台,通过自然语言输入将用户的创意想法转化为专业级视觉设计。用户只需用简单文字描述需求,Lovart 就能生成海报、品牌标识、视频和3D内容等多种设计资产。该平台整合了多种AI模型,...
DeepMosaics:自动去除图像和视频中的马赛克,或向其添加马赛克
DeepMosaics是一个基于语义分割和图像到图像转换技术的开源项目,旨在自动移除图片和视频中的马赛克,或向其添加马赛克效果。该项目利用深度学习的力量,为用户提供了一种高效的方法来处理马赛克图像,无论是去码...
Hedra
Hedra 是一个创新的数字创作平台,专注于通过人工智能技术生成富有表现力的会说话和会唱歌的人物角色视频。用户可以从简单的文本和图像生成专业质量的视频,无需任何技术专长。Hedra 旨在让每个人都能轻松创作引...
SkyReels:AI视频短剧创作平台,擅长生成动作自然的全景人像
SkyReels 是一个专注于 AI 视频创作的在线平台,旨在帮助用户快速将文本脚本或创意想法转化为高质量短视频。无论你是内容创作者、营销人员还是普通用户,只需输入文字,平台就能自动生成带有逼真语音、精准字幕和...
Remaker:免费在线换脸工具
Remaker AI 是一个利用最新人工智能技术开发的创新工具集,支持创建和生成各种类型的内容,包括文本、图像、语音等。用户可以通过该平台进行照片和视频的面部交换、生成AI肖像、图像放大、制作会说话的照片等。Re...
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具
Vidnoz是一款免费的AI视频生成平台,可在1分钟内快速创建AI视频。不需要成本、下载和经验。平台提供500+ AI虚拟人物,470+逼真AI配音以及500+模板。通过Vidnoz AI视频生成器,用户可以更快地创建视频,从而提高投...
可灵 AI:快手推出的生成创意图片和视频的AI工具
可灵 AI(Kling AI)是快手推出的一款新一代AI创意生产力平台,旨在通过先进的生成式AI技术,帮助用户轻松创建高质量的图片和视频内容。平台基于快手自研的可图大模型和可灵大模型(Kolors),提供了强大的图像和...
LTX Studio
LTX Studio 是一个创新的 AI 驱动视频创作平台,专为创作者、营销人员、电影制作人和工作室设计。它提供从故事构思、分镜生成、动效添加到后期编辑的全流程操作,帮助用户将创意概念转化为详细的故事板和高质量的...
ClipZap AI换脸工具
ClipZap AI换脸工具 是一个领先的AI换脸工具,专为照片和视频的换脸需求而设计。该网站利用先进的人工智能技术,自动识别视频和图像中的人物,并进行高质量的面部替换。无论是创建有趣的表情包、动画贴纸,还是制...
置顶OpenWispr:隐私优先的语音转文字桌面应用
OpenWispr 是一款开源的桌面语音转文字应用,基于 OpenAI Whisper 技术,将用户语音快速转换为文本。它提供本地和云端处理选项,强调隐私保护,数据可完全留存在本地。用户通过全局热键快速启动听写,文本自动粘...
置顶MiniMax Audio(海螺语音):生成自然语音的AI工具
MiniMax Audio 是 MiniMax 公司推出的一款 AI 语音生成工具,核心特点是快速将文字转为高相似度的自然语音。它基于 Speech-02 模型,语音合成相似度高达 99%,音质达到录音室级别,支持超过 30 种语言和多种口...
置顶通义听悟:阿里通义音视频内容转录AI助手
通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的转写和分析。它依托阿里云的强大AI模型,能够将音视频内容实时转写成文字,并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景,帮助用户...
gibberlink:两个AI智能体间高效音频通信的演示项目
gibberlink 是一个由开发者 PennyroyalTea 在 GitHub 上开源的项目,专注于实现两个对话型 AI 智能体之间的通信优化。当两个 AI 智能体通过电话交谈并识别出彼此均为 AI 时,它们会从人类语言(英语)切换到一...
小智 AI 聊天机器人
小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实际的硬件设备中。项目...
“Always-On” Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统
Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统。该项目特别针对工程开发场景进行优化,提供了完整的...
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)
Kokoro-FastAPI是一个基于Docker的FastAPI封装,旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速,并提供了队列处理和自动拼接功能,使得生成长文本的语音输出更加高效和连贯。项目由Gi...
EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎
EmotiVoice是一个由网易有道开发的多声音和情感提示控制的文本转语音(TTS)引擎。此开源TTS引擎支持英文和中文,拥有超过2000种不同的声音,并具备情感合成能力,能够创建带有快乐、兴奋、悲伤和愤怒等多种情绪的...
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式
OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多...
Memo AI:视频转字幕、转换多语言字幕的本地客户端
MemoAI是一款功能强大的视频翻译工具,专门用于将视频和音频文件转换为文本、字幕和笔记。不论是YouTube视频、播客还是本地文件,MemoAI都能轻松处理。支持中、英、日等90多种语言的转录与翻译。MemoAI利用最新的...
TTSMaker:免费的在线文本转语音工具
TTSMaker是一款免费的在线文本转语音工具,支持100多种语言和300多种语音风格。用户可以将文本转换为自然流畅的语音,并下载音频文件用于商业用途。该工具适用于视频配音、有声读物、教育培训和广告营销等多种场...
edge-tts:文本转语音Python模块|免费文本转语音服务
edge-tts是一个开源的Python模块,允许用户在Python代码中使用微软Edge的在线文本转语音服务,而无需Microsoft Edge浏览器、Windows操作系统或API密钥。提供了命令行下直接使用的edge-t...
置顶ARGO:在个人电脑上部署和使用的AI智能体客户端
ARGO 是一款开源的AI智能体(AI Agent)平台,它的核心设计理念是“本地优先”,让用户可以在自己的个人电脑上搭建一个功能强大的专属AI助手。这个平台整合了AI领域的多种先进技术,比如能够让AI自主思考和规划任务...
置顶MAESTRO:拥有本地知识库和多代理协作的深度研究助手
MAESTRO 是一个开源的 AI 研究工具,旨在帮助用户处理复杂的科研任务。它通过文档管理、检索增强生成(RAG)和多代理协作,提供从研究规划到报告生成的完整流程。用户可以上传 PDF 文档,借助 AI 代理完成信息检...
置顶蛙蛙写作:快速生成小说大纲与内容的AI写作工具
蛙蛙写作 是一款专为小说作者设计的AI智能写作工具。它能帮助用户快速生成小说大纲、角色设定和正文内容,适合需要灵感或高效创作的写作者。用户通过微信扫码登录,无需下载软件,直接在网页端操作。平台提供自动...
置顶Cotrans:一站式漫画图片翻译器(开源免费)
manga-image-translator(Cotrans翻译器开源版),用于翻译漫画或图片中的文字。提供命令行交互方式和在线演示,拥有批量转换模式、web服务器模式等多样化的使用选项。可设置多种语言目标翻译和识别参数,配有详...
Speak
Speak 是一款创新的 AI 英语学习应用程序,旨在通过与 AI 对话来帮助用户提升英语口说能力。该应用程序利用最先进的人工智能技术,提供个性化的课程和即时反馈,帮助用户在短时间内显著提高英语水平。Speak 提供...
Liner
Liner是一款由GPT-4/Cloude驱动的AI搜索引擎,旨在帮助用户更高效地查找、管理和利用在线内容。无论是学术研究、专业写作还是日常信息整理,Liner都能提供智能化的解决方案。通过浏览器扩展或移动应用,用户可以...
Connected Papers
Connected Papers是一款专为研究员和科学家设计的学术论文探索工具。通过构建论文间的关联图谱,帮助用户可视化探索各自研究领域内相关论文。用户可输入论文标识符,如DOI、arXiv、论文URL、论文标题、Semantic S...
SciSpace
SciSpace(原Typeset.io)是一个专为学术研究和写作设计的AI驱动平台。它提供了丰富的工具和资源,帮助研究人员和学生更高效地进行文献查找、理解和写作。平台集成了文献管理、自动格式化、AI写作助手等功能,旨...
PopAI
PopAI致力于通过创新AI技术改善教育场景的应用,提供个性化学习体验;是一个智能工作空间平台,集成了多种AI工具以加强你的文档互动、图像生成以及PPT创建的能力。 PopAI可能由国内零一万物推出。 PopAI ...
天工AI
天工AI是国内首款全能AI助手,集成了搜索、对话、写作、文档分析、画画、PPT制作等多种功能。它通过先进的人工智能技术,能够理解用户意图,搜索全网信息,并进行归纳、概括和整合,输出高质量、无广告的搜索结果...
Genspark:基于Genspark智能体深度搜索并撰写研究报告
Genspark 是一个基于人工智能的搜索工具。它由前百度高管于2023年创立,总部位于美国加州帕洛阿尔托。它与传统搜索引擎不同,Genspark 使用多个 AI 智能体实时生成定制化的搜索结果页面,称为“Sparkpages”。这些...
Translator
一个可以将电子书翻译成指定语言(原文译文对照)的 Calibre 插件。 主要功能 支持多种翻译模式:批量模式和高级模式,满足不同的使用场景 支持所选翻译引擎所支持的语言(如Google翻译支持.....
置顶Kode:Claude Code 开源优化版
Kode是一个强大的AI助手,它直接在你的电脑终端里运行。你可以把它看作一个和你一起工作的程序员,它能理解你的代码库,帮你编辑文件,还能执行命令行指令来处理整个开发流程。和其他工具不同的是,Kode可以同时...
置顶Storydoc:快速创建与编辑互动演示文稿的智能工具
Storydoc 是一个帮助用户快速创建互动演示文稿的在线平台。它通过人工智能技术简化设计流程,让用户无需专业技能也能制作出吸引人的幻灯片。Storydoc 提供多种模板,适用于营销、销售、投资、招聘和报告等多种场...
置顶Had No Idea:快速生成并验证创业想法的AI工具
Had No Idea 是一个帮助用户快速生成、验证和启动创业项目的免费AI工具。它针对没有明确创业方向的用户,10分钟内从零开始生成个性化创业想法,验证市场可行性,创建品牌形象,并生成可直接用于开发的蓝图。工具...
置顶Claudia:管理Claude Code的图形界面工具
Claudia 是一个开源的桌面应用程序,专为 Claude Code 用户设计。它通过直观的图形界面(GUI)简化了 Claude Code 的操作,取代了传统的命令行方式。用户可以更轻松地管理 AI 开发项目、创建自定义代理、运行后台....
Codeium(Windsurf Editor):免费的AI代码补全与聊天工具,Windsurf以对话方式编写完整项目代码
Codeium是一款免费的AI代码补全与聊天工具,旨在提升开发者的编程效率。它支持超过70种编程语言,并与40多种集成开发环境(IDE)兼容。Codeium不仅提供代码自动补全功能,还具备代码生成、代码解释和聊天功能,帮...
Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手
Roo Code(前称Roo Cline)Roo Code(Roo Cline) 是一个基于 Cline 的增强版自主编程助手,它是一个强大的 VS Code 扩展插件。这个工具能够在您的集成开发环境(IDE)中实现自主编码,具备创建和编辑...
Trae:字节跳动推出的免费AI编程工具
Trae是一款由字节跳动推出的免费AI编程工具,专为中文开发者设计的集成开发环境(IDE)。它利用Claude 3.5和GPT-4o等先进的AI模型,帮助开发者快速生成、优化和调试代码。Trae支持原生中文界面,提供了Builder模...
Cline(Claude Dev):自动化编程的VSCode插件
Cline 是一个功能强大的 VSCode 插件,旨在通过自动化任务执行和链式思维提示,帮助开发者高效完成各种编程任务。它不仅能创建和编辑文件,还能执行终端命令,提供人机协作的编程体验。用户可以通过简单的指令启...
Cursor:与AI共同编程的代码编辑器
Cursor 综合介绍 Cursor是一个基于OpenAI GPT模型的AI驱动的代码编辑器,它可以帮助您更快地编写,编辑,调试,和修复代码。您可以与您的项目进行聊天,参考文件和文档,生成代码,以及发现和解决错误。Cursor是V...
Bolt:实时AI驱动的全栈开发平台,快速运行、编辑和部署全栈 Web 应用
综合介绍 Bolt.new 是由 StackBlitz 推出的创新平台,结合了 AI 和 WebContainers 技术,旨在简化全栈 Web 应用的开发过程。用户无需复杂的开发环境配置,即可在浏览器中完成从编写代码到部署应用的所有步骤。...
Granola:AI会议助手,转录会议讨论内容并用AI增强会议记录
Granola 是一款利用人工智能技术提升会议效率和记录准确性的工具。它可以实时转录会议内容,自动生成智能笔记,并提供详细的会议分析。Granola 旨在帮助用户更好地管理会议记录,提升工作效率。目前,该工具主要...
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具
Vidnoz是一款免费的AI视频生成平台,可在1分钟内快速创建AI视频。不需要成本、下载和经验。平台提供500+ AI虚拟人物,470+逼真AI配音以及500+模板。通过Vidnoz AI视频生成器,用户可以更快地创建视频,从而提高投...
置顶Akool:生成图像和视频营销素材|视频换脸|视频翻译|人像说话
Akool是一个专注于个性化视觉营销和广告。通过先进的AI技术,AKOOL能够帮助用户轻松创建高质量、个性化的视频内容,适用于广告、在线教育、艺术创作和电子商务等多个领域。 它提供了面部换位、真实头像创建、说话...
Video Face Swap
Video Face Swap 是一款完全免费的 AI 换脸工具,用户可以在任何视频中轻松替换人脸。该工具支持实时或后期处理换脸,适用于视频、照片和 GIF 动画。其智能算法能够识别视频中的面部并进行精确替换,生成逼真且有...
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作
FaceFusion是一个集成了面部交换与增强功能的先进云平台,优化了“图像到视频”、“图像到图像”的交换过程,并拥有5个专业模型,以确保无瑕的输出。此外,它通过7种模型进行面部增强,使用3种不同模型提升视频和图片...
DeepFaceLive:经典实时人脸替换工具
DeepFaceLive 是一个开源的实时人脸替换工具,主要用于视频通话和直播。用户可以通过摄像头或视频中的人脸进行替换,使用预训练的模型实现高质量的人脸替换效果。该工具支持多种人脸模型,并允许用户自行训练和导...
Remaker:免费在线换脸工具
Remaker AI 是一个利用最新人工智能技术开发的创新工具集,支持创建和生成各种类型的内容,包括文本、图像、语音等。用户可以通过该平台进行照片和视频的面部交换、生成AI肖像、图像放大、制作会说话的照片等。Re...
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统
Paperless-AI 是一个创新的文档自动化分析工具,专门为 Paperless-ngx 文档管理系统设计。它巧妙地结合了 OpenAI API 和 Ollama 等多种先进的人工智能模型(包括 Mistral、LLaMA、PHI-3 ...
InsightFace:图像面部交换功能与面部克隆
InsightFace 综合介绍 InsightFace是一款开源的2D及3D深度面部分析库,提供多种先进的面部识别、检测和对齐算法。该库以高效的训练和部署为设计目标,适合研究机构和产业界使用。InsightFace支持Pyt...
VisoMaster:强大且易用的图片/视频换脸和编辑软件
VisoMaster 是一款强大且易用的视频换脸和编辑工具,利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频,VisoMaster 都能通过简单的操作生成高质量的换脸结果,适合普通用户和专业人士使用。该工具支...
FaceSwapper
FaceSwapper 是一个基于人工智能技术的在线免费换脸平台,用户可以通过上传照片或视频,快速实现面部替换,生成有趣或逼真的效果。无需专业技能,只需几次点击,就能将自己的脸换到他人身上,或体验性别转换、名...
ClipZap AI换脸工具
ClipZap AI换脸工具 是一个领先的AI换脸工具,专为照片和视频的换脸需求而设计。该网站利用先进的人工智能技术,自动识别视频和图像中的人物,并进行高质量的面部替换。无论是创建有趣的表情包、动画贴纸,还是制...
FlowGPT
FlowGPT 简介 FlowGPT是一个专注于分享和使用AI和GPT机器人的在线社区。在这里,您可以免费与各种AI角色和应用进行聊天,获取来自简历编辑器、文章生成器、编程向导等的即时答案。您也可以创建和分享您自己的对话...
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播
Deep Live Cam 是一个开源的人工智能工具,旨在通过单张照片实现实时换脸和深度伪造视频生成。该工具利用先进的深度学习算法,能够在直播或视频通话中实时替换人脸,保护用户隐私并增加趣味性。Deep Live Cam 支...
置顶Had No Idea:快速生成并验证创业想法的AI工具
Had No Idea 是一个帮助用户快速生成、验证和启动创业项目的免费AI工具。它针对没有明确创业方向的用户,10分钟内从零开始生成个性化创业想法,验证市场可行性,创建品牌形象,并生成可直接用于开发的蓝图。工具...
置顶ListenHub:将网页、文件快速转为AI播客的工具
ListenHub 是一个利用人工智能技术将网页、文档或用户输入的内容快速转化为播客的平台。它支持中英文语音合成,用户只需上传文件、输入话题或粘贴链接,即可生成自然流畅的播客音频。平台操作简单,适合移动端使...
置顶KrillinAI
KrillinAI 是一个开源的视频处理工具,专注于用人工智能帮助用户翻译视频并自动配音。它能从视频下载开始,一直到生成适配不同平台的成品,全程只需几次点击。开发者在 GitHub 上提供了免费代码,用户可以下载到...
置顶LLPlayer
LLPlayer 是一款专为语言学习者设计的开源媒体播放器,托管于 GitHub,由开发者 umlx5h 创建。它集成了多种实用功能,如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等,旨在帮助用户通过观看视频提升语言...
SoniTranslate
SoniTranslate 是一个强大且用户友好的视频多语言配音工具,旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术,将视频内容翻译成多种语言,并保持音频同步。该项目基于 Gradio 库构建...
Suno:用想象力创作音乐|AI音乐生成软件
与许多 AI 音乐应用程序不同,Suno(发音为 soon-oh,在印地语中意为“听”)专注于用原创人声创作原创曲调,而不是克隆或模仿流行艺术家的声音或歌曲。 Suno 综合介绍 Suno是一个让您用想象力和AI创作歌曲...
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型
Kolors Virtual Try-On 是由 Kwai-Kolors 团队在 Hugging Face 平台上推出的一款虚拟试穿应用。该应用利用先进的人工智能技术,帮助用户在虚拟环境中试穿不同颜色的服装,从而找到最适合自己的颜色。用户只...
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具
Vidnoz是一款免费的AI视频生成平台,可在1分钟内快速创建AI视频。不需要成本、下载和经验。平台提供500+ AI虚拟人物,470+逼真AI配音以及500+模板。通过Vidnoz AI视频生成器,用户可以更快地创建视频,从而提高投...
即梦AI
即梦AI是一个一站式的AI创作平台,旨在为用户提供多功能且强大的创作工具。无论是图像生成、智能画布、视频生成还是音乐生成,即梦AI都能帮助用户轻松实现创意。平台支持多种创作模式,包括AI作图、AI视频、AI音...
可灵 AI:快手推出的生成创意图片和视频的AI工具
可灵 AI(Kling AI)是快手推出的一款新一代AI创意生产力平台,旨在通过先进的生成式AI技术,帮助用户轻松创建高质量的图片和视频内容。平台基于快手自研的可图大模型和可灵大模型(Kolors),提供了强大的图像和...
RenderNet
RenderNet 是一款基于人工智能技术专注于创作保持人物一致性的图像与视频的生成工具。用户可以通过简单的文本提示生成角色驱动的图像和视频。该工具支持多种图像和视频生成选项,用户可以根据需要进行自定义,并...
PDF2Audio:将PDF转换为音频的工具,PDF转播客
PDF2Audio 是一个开源项目,旨在将 PDF 文件转换为音频内容,如播客、讲座和摘要。该工具利用 OpenAI 的 GPT 模型进行文本生成和文本到语音转换,用户可以上传多个 PDF 文件,选择不同的指令模板(如播客、讲座、...
置顶RenderNet
RenderNet 是一款基于人工智能技术专注于创作保持人物一致性的图像与视频的生成工具。用户可以通过简单的文本提示生成角色驱动的图像和视频。该工具支持多种图像和视频生成选项,用户可以根据需要进行自定义,并...
Topview:一键创建病毒式营销视频,AI虚拟形象展示并讲解商品
Topview 是一款基于人工智能的在线视频编辑工具,旨在帮助用户通过上传简单的材料和想法,生成高质量的病毒式营销视频。它利用先进的AI技术,包括GPT-4o来生成脚本,并结合来自TikTok和YouTube的成功广告学习,确...
VidAU:视频换脸与视频多语言翻译工具
VidAU.AI 是一款集视频和音频生成于一体的AI工具,提供视频代言人、换脸、多语言翻译、字幕和水印去除、视频混剪和编辑等多种功能。它支持创建包括短剧、广告、销售推介、社交媒体内容和培训视频在内的多样化视频...
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布
MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目,旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营销等功能。用户可以利用Python脚本进行内容发布...
即创:依托巨量引擎生成电商营销物料,快速发布适合抖音推广的商品讲解视频
即创介绍 即创是抖音推出的一站式智能创意生产与管理平台,旨在为创作者提供高效、便捷、专业的内容创作服务。即创平台集成了多种AI功能,如智能成片、AI视频脚本、图文工具、商品卡工具、AI直播背景、AI直播脚本...
Arcads:AI驱动创意视频广告生成器
Arcads是一个AI驱动的视频广告创作平台,仅需用户提供文本或产品链接,即可迅速转换成高质量、情感丰富的短视频广告。Arcads拥有大量AI演员库,通可以将文本脚本转化为引人入胜、真实且吸引人的视频广告。过利用...
Vsub:输入文字或模板生成无需露脸的病毒营销视频
Vsub 是一个专注于自动化视频内容制作的平台,旨在帮助内容创作者快速生成无脸视频(faceless videos)。它利用人工智能技术,允许用户通过输入文本或选择预设模板来创建适合YouTube、TikTok等平台的视频内容。特...
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人
AI Chatbot Supabase是一个基于Next.js和Supabase构建的开源AI聊天机器人模板。该项目由Vercel开发,旨在提供一个功能全面、可定制的聊天机器人解决方案。通过集成Supabase数据库,用户可以实现聊天记录和...
文心智能体平台:建立在完整分发渠道和商业闭环的智能体应用
介绍 文心智能体平台AgentBuilder 是百度推出的基于文心大模型的智能体(Agent)平台,支持广大开发者根据自身行业领域、应用场景,选取不同类型的开发方式,打造大模型时代的产品能力。开发者可以通过 prompt 编...
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人
Dupdub是侧重播客和视频演示文稿创作平台,提供一系列AI工具来支持用户的创造力。功能覆盖从文本到视频的创作,提供人工智能语音和视频配音服务,以及视频编辑、转录和字幕制作。 Dupdub又出门问问推出,国内产品...
Copy.AI:智能营销文案生成工具,适合营销自动化和电商文案写作
Copy.AI 综合介绍 Copy.ai是一个为营销和销售团队设计的人工智能平台,无论您需要写博客文章、社交媒体帖子、电子邮件、产品描述、广告文案,还是其他任何类型的内容,Copy.ai都可以为您提供灵感和创意,专注于提...
Klap
Klap 是一款基于人工智能的视频编辑工具,专为内容创作者设计,旨在将长视频转化为适合社交媒体平台(如 TikTok、Instagram Reels 和 YouTube Shorts)的短视频。用户只需粘贴 YouTube 链接或上传视频,...
置顶ARGO:在个人电脑上部署和使用的AI智能体客户端
ARGO 是一款开源的AI智能体(AI Agent)平台,它的核心设计理念是“本地优先”,让用户可以在自己的个人电脑上搭建一个功能强大的专属AI助手。这个平台整合了AI领域的多种先进技术,比如能够让AI自主思考和规划任务...
置顶dots.ocr:多语言文档布局解析的统一视觉-语言模型
dots.ocr 是一个强大的多语言文档解析工具,基于 1.7B 参数的视觉-语言模型(VLM),能够同时进行布局检测和内容识别。它在 OmniDocBench 等基准测试中展现了最先进的性能,特别是在文本、表格和阅读顺序解析方面...
置顶MAESTRO:拥有本地知识库和多代理协作的深度研究助手
MAESTRO 是一个开源的 AI 研究工具,旨在帮助用户处理复杂的科研任务。它通过文档管理、检索增强生成(RAG)和多代理协作,提供从研究规划到报告生成的完整流程。用户可以上传 PDF 文档,借助 AI 代理完成信息检...
置顶MiniMax Agent:支持多模态交互的智能AI助手
MiniMax Agent 是一个基于先进多模态大语言模型的智能AI助手,旨在提升用户的生产力和创造力。它由上海MiniMax公司开发,成立于2021年,获得阿里巴巴等多家投资机构支持。MiniMax Agent通过集成文本、图像、语音.....
Ollama:本地一键部署开源大语言模型
Ollama 综合介绍 ollama是一个轻量级的本地语言模型运行框架,让用户能够容易地搭建和运行大型语言模型。它提供多种快速开始和安装选项,支持Docker,包含了丰富的库供用户选择。它的使用方法简单,提供了REST AP...
Page Assist:本地AI模型对话与检索文档的网页助手插件
Page Assist 是一个开源的浏览器扩展,旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展,用户可以在任何网页上打开一个侧边栏,与本地运行的AI模型进行互动。Page Assist 支持多种浏览器,包括Chrome、B...
OpenRouter:集成多LLMs的统一接口,免费大模型接口
OpenRouter是一个大模型API聚合平台,提供了让用户可以方便地接入和使用多种大型语言模型的能力。用户可以比较不同模型和价格,为自己的情景需求找到最合适的解决方案。OpenRouter支持包括OpenAI的GPT-4、Claude ....
Coze(扣子):免费创建个人智能体和工作流
Coze是一个创新的聊天机器人开发平台,旨在简化AI对话应用的创建过程。它提供了丰富的功能集合,包括插件系统、工作流编辑、知识管理、长期记忆以及定时任务安排,无需任何编程知识即可设计出能在各种社交平台和...
Ollama OCR:使用Ollama中视觉模型提取图像中的文本
Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Streamlit网页应用程序界面。它支持多种视觉模...
Docling:支持多种格式文档解析并导出为Markdown和JSON,PDF支持OCR
Docling 是一个强大的文档解析和导出工具,支持多种文档格式,包括 PDF、DOCX、PPTX、XLSX、图像、HTML、AsciiDoc 和 Markdown。它能够将这些文档解析并导出为 HTML、Markdown 和 JSON 格...
Repo Prompt:依赖本地文件夹上下文进行写作、对话与优化代码
Repo Prompt是一款专为macOS平台打造的原生应用程序,致力于简化开发者使用先进AI语言模型处理本地代码的流程。该工具通过智能化的方式帮助开发者管理和修改代码文件,显著提升开发效率。其核心优势在于为开发者...
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描
MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF文档转化为易于分析的Markdown格...
置顶VideoMind
VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频的方式,把任务拆成规划、定位、验...
OmniGen
OmniGen 是一个由 VectorSpaceLab(智源) 开发的“通用”图像生成模型,允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别人物和一致性角色渲染的场景。用户...
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型
LTX-Video是由Lightricks开发的首个基于DiT(Diffusion Transformer)的实时视频生成模型。该模型能够在768×512分辨率下以24帧每秒的速度生成高质量视频,速度快于观看视频的时间。LTX-V...
Qwen2.5-Omni
Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入,并实时生成文本或自然语音响应。这款模型于 2025 年 3 月 26 日发布,代码和模型文件托管在 GitH....
Reka:提供多模态AI模型,支持多语言处理,优化数据分析,增强视觉理解
Reka 是一家致力于提供新一代多模态AI解决方案的公司。其产品包括Reka Core、Flash、Edge和Spark等多种型号,支持文本、代码、图像、视频和音频数据的处理。Reka 的模型具有强大的推理能力和多语言支持,适用于各...
VITA
VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024年12月,项目推出了重大升级版...
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS
OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构,支持语音克隆功能,能够生成具有随机说...
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型
Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多种语言,还能实现情感表达和个性化语音克...
AnyText
AnyText是一个革命性的多语言视觉文本生成和编辑工具,基于扩散模型开发。它能够在图像中生成自然、高质量的多语种文本,并支持灵活的文本编辑功能。该项目由研究团队开发,并在ICLR 2024会议上获得Spotlight荣誉...
DeepSeek-VL2
DeepSeek-VL2 是一系列高级的 Mixture-of-Experts (MoE) 视觉语言模型,显著提升了其前身 DeepSeek-VL 的性能。该模型在视觉问答、光学字符识别、文档/表格/图表理解和视觉定位等任务中表现出色。De...
StarVector:从图像和文字生成SVG矢量图的基础模型
StarVector 是一个开源项目,它由 Juan A. Rodriguez 等开发者创建,目的是将图像和文字转化为可缩放矢量图形(SVG)。这个工具使用视觉语言模型,能够理解图像内容和文字指令,生成高质量的 SVG 代码。它的核心...
CogView3:智谱轻言开源的级联扩散文本生成图像模型
综合介绍 CogView3 是由清华大学和智囊团队(智谱清言)开发的先进文本生成图像系统。它基于级联扩散模型,通过多阶段生成高分辨率图像。CogView3 的主要特点包括多阶段生成、创新架构和高效性能,适用于艺术创作...
Kode是一个强大的AI助手,它直接在你的电脑终端里运行。你可以把它看作一个和你一起工作的程序员,它能理解你的代码库,帮你编辑文件,还能执行命令行指令来处理整个开发流程。和其他工具不同的是,Kode可以同时...
Wan是一个AI驱动的视觉内容生成网站,其核心是名为Wan 2.2的开源模型。用户可以通过这个工具,将文字、图片或音频快速转换成高质量的视频。网站支持多种生成方式,包括“文字生成视频”、“图片生成视频”以及独特的“...
TransyncAI,中文名称为“同言翻译”,是一款利用人工智能技术提供实时翻译和会议纪要服务的软件工具。 它主要解决在跨国会议、商务沟通或国际交流中遇到的语言障碍问题。该工具采用端到端的语音大模型技术,能够将...
Frame0 是一款桌面应用程序,主要用于快速创建具有手绘风格的线框图。 它通过模仿手绘效果,帮助设计者和产品经理在项目早期专注于核心想法和布局,而不是陷入颜色、字体等视觉细节的讨论中。 这种低保真风格明确...
AI风水是一个在线工具,它使用人工智能技术为用户的居住和工作空间提供个性化的风水建议。 用户可以上传户型图、房间照片,或是自己绘制的草图,系统会结合经典的风水原则、生辰八字(BaZi)以及现代空间分析技术...
神数AI是一个运用人工智能技术解读中国传统命理(八字)的在线工具。 用户输入公历或农历的出生年、月、日、时,网站就能生成对应的“四柱八字”命盘。 它通过分析命盘中的天干地支、五行生克、十神关系等元素,为...
mcp-echarts 是一个可以让AI大语言模型(LLM)动态生成 Apache ECharts 可视化图表的工具。 它扮演一个模型上下文协议(MCP)服务器的角色,AI助手可以通过调用这个服务,根据用户输入的指令和数据,创建出丰富的.....
nanocoder 是一个在本地终端环境中运行的AI编程工具,它的核心设计理念是“本地优先”,充分保护用户的隐私和数据安全。 这个工具让开发者可以在自己的电脑上,通过命令行界面与AI进行交互,完成代码编写、审查和重...
LlamaFarm是一个功能全面的模块化AI开发框架,它的核心设计理念是“本地优先开发,随处部署”。这个框架让开发者可以在自己的电脑上构建、测试和运行整套AI系统,然后再将同样的代码无缝部署到生产环境,无论是公司...
DbRheo-CLI是一个数据库操作和数据分析的命令行代理工具。 它允许用户使用自然语言下达指令,工具会将其转换成安全的SQL查询并执行。 这个工具还能自动探索和分析数据库的结构,并且内置了风险评估系统,可以预先...
M3-Agent是由字节跳动SEED团队开发的一个多模态智能体框架。它的核心特点是拥有长期记忆能力,能够像人类一样,通过处理实时的视频(看)和音频(听)输入,来建立并不断更新自己的记忆。这个记忆系统不只是记录...
AlignLab 是一个由 OpenAlign 团队开发的开源项目,它提供了一套完整的框架和工具,专门用于对齐大语言模型。所谓“对齐”,是指让模型的行为和输出更符合人类的期望与价值观,例如确保其安全性、真实性、无偏见和...
无论是 Cursor、Claude Code,还是 Aider、RooCode 等工具,各类 AI 编程工具正带着其独特的指令配置方法(如 .cursor/rules/、GEMINI.md 等)进入市场。这种多样性反映了不同团队的创新思路,...
数据可视化通常需要繁琐的编程或复杂的图形界面操作,但现在有了新的选择。蚂蚁集团开源的数据可视化库 AntV 生态下的 @antv/mcp-server-chart 项目,让用户可以通过自然语言指令快速生成各种主流图表,极大地简...
随着 Claude Code 这类代理式终端编程工具的兴起,一种全新的开发模式正在形成。这类工具允许开发者在终端环境中,通过人工智能代理执行从需求分析到代码实现、测试和修复的复杂任务。然而,其原生的交互体验和功...
Dify 作为一个开源的 LLM 应用开发平台,凭借其从 Agent 构建、AI workflow 编排到 RAG 检索和模型管理的全方位能力,在开发者社区中获得了广泛关注。它以优雅的设计和流畅的体验著称,同时开发团队惊人的迭代速...
Claude Code:终端中的智能开发代理 Anthropic 推出的命令行工具 Claude Code 并非又一个聊天窗口或 IDE 插件,而是一个原生集成在终端环境的开发代理。它能理解项目结构,读写文件,执行命令,甚至协调多个子代.....
在AI应用开发领域,一个经过精心设计的 Prompt,其表现可能极不稳定,昨天效果出色,今天面对新场景却可能收效甚微。这种效果的随机性与不可预测性,是阻碍AI应用从原型走向规模化生产的关键障碍。所有追求服务持...
一个现象很常见:即使 RAG 系统用了最强的 LLM,Prompt 也经过了反复调校,问答效果依然不理想,答案要么上下文不全,要么存在事实错误。 工程师们检查了检索算法,优化了 Embedding 模型,但常常忽略了数据进入...
在 8 月 8 日的发布会上, Open AI 的首席执行官 Sam Altman 宣布了新一代旗舰模型 GPT-5。据介绍, GPT-5 在准确性、速度、推理、上下文理解及结构化思维方面均有显著提升,与它对话的体验接近于“与领域博士交流....
在 AI 辅助开发的浪潮中,开发者不断寻求将顶尖语言模型与本地工作流无缝集成的最佳实践。 Anthropic 推出的 Claude Code 作为一款强大的终端原生 AI 助手,可以直接理解并操作整个代码库,极大地提升了开发效率...
在 Gamma 、 Microsoft Copilot 等AI驱动的演示文稿工具日益普及的今天,多数用户习惯于在图形化界面中通过简单指令一键生成幻灯片。 这些工具极大地提升了效率,但有时会显得模板化,缺乏深度定制的灵活性。然而...
对于研究人员而言,文献管理是一项持续的挑战。大量文献的搜集、整理、阅读和引用,构成了科研工作中繁重但至关重要的一环。传统的手动管理方式不仅效率低下,还容易在关键时刻找不到所需资料。幸运的是,借助现...
制作演示文稿的传统流程,往往意味着在内容构思、视觉设计和排版对齐之间无休止地投入时间。对于许多非设计专业人士而言,PowerPoint 或 Keynote 就像一座难以逾越的大山。幸运的是,人工智能正在从根本上改变这...
常见问题员工搜索内部文档时,往往因表述差异导致检索失败。LKE的多维度优化方案可显著改善该问题。改进方法同义词...
需求场景传统教育机构难以为学员提供动态学习建议。LKE的工作流功能可结合学员测试记录和知识图谱生成个性化方案。...
风险分析金融领域的监管政策和产品条款更新频繁,单纯依赖大模型易产生事实幻觉。LKE的RAG(检索增强生成)机制...
问题背景电商大促期间客服咨询量激增,人工响应速度与质量问题显著。LKE的Agent智能体可实现7×24小时自动...
背景与痛点分析企业知识通常分散在多个系统、文档和员工头脑中,导致信息检索效率低下。腾讯云LKE通过集中化知识管...
上下文感知的智能交互系统LKE的QueryRewrite模块采用注意力机制与对话状态跟踪技术,能有效处理三类典...
专业模型的技术性能验证基于文中提供的数学问题测试集,DeepSeek-R1在LKE环境下表现出色:对于涉及速度...
可视化配置的技术民主化实践腾讯云LKE通过四个核心设计实现低代码目标:1)拖拽式工作流编辑器,2)预置20种行...
检索增强生成的技术实现路径腾讯云LKE的RAG模块采用双通道检索机制:基于BM25算法处理关键字匹配,结合稠密...
腾讯云LKE的核心定位与架构腾讯云大模型知识引擎(LKE)本质上是一个将先进的大语言模型能力与企业私有数据相结...
相比其他AI知识管理平台,腾讯云LKE具有以下独特优势:腾讯生态整合:深度对接腾讯云基础设施,享受完整的云计算...
为确保LKE平台知识问答的准确性和完整性,可以采取以下措施:优化知识源质量:上传前检查文档内容,避免使用模糊的...
回顶部