V-JEPA 创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。 01230 AIGC开发平台AI开源项目# ai# Transformer模型# 多模态学习
Llama 3.2 在图像理解和文本处理任务上展现出卓越的性能,并通过定制化微调和本地部署,推动了AI技术的开放性和可访问性。 01230 AIGC开发平台AI开源项目# ai# AI大模型# 图像理解
VideoPoet 强大的AI视频生成工具,它通过大型语言模型架构和多模态输入处理能力,实现了从文本到视频的转换、图像动画生成、视频风格化、视频编辑和音频生成等多种功能。 01220 AIGC开发平台AI开源项目# ai# AI视频合成# Transformer架构
Animate Anyone 一个功能强大且易于使用的图像到视频角色动画合成框架。它通过实时动画合成技术和用户友好的界面,使得动画制作变得更加简单和快捷。 01220 AIGC开发平台AI开源项目# ai# AI技术# 交互体验
AnimateDiff 通过预训练的运动建模模块,使得用户能够轻松地创作出丰富多样的动画内容,同时保持了原有模型的风格和特性。它的跨领域应用性和易于集成的特点,极大地扩展了个性化动画的创作空间。 01210 AIGC开发平台AI开源项目# ai# Transformer模型# 个性化内容生成
ScreenAgent 一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。 01200 AIGC开发平台AI开源项目# ai# ScreenAgent# VLM
AI开搭 AI开搭是专业AI机器人应用搭建发布平台,支持大模型LLM切换/知识库/插件/工作流配置,一键发布到自己的网站/飞书/微信/钉钉群等场景,任何个人/企业/开发者都无需编程通过开搭创建... 01200 AIGC开发平台AI编程工具# ai# AI应用# 一键发布
GPT-SoVITS 一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。 01190 AIGC开发平台AI开源项目# ai# 个性化助手# 人工智能
书生·物华2.0(3DTopia 2.0) 采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。 01190 AIGC开发平台AI开源项目# ai
Outfit Anyone 一个创新的AI服装虚拟试穿工具,它通过智能技术为用户和模特提供了一种全新的服装试穿体验。无论是消费者、设计师、模特还是电商从业者,都可以利用这个工具来探索和展示服装,为... 01190 AIGC开发平台AI开源项目# ai# 个性化推荐# 时尚科技
Codeium Codeium是现代编码超级大国,是一个免费的人工智能代码完成工具。它支持超过20多种语言,并与您最喜欢的ide集成。 01190 AIGC开发平台AI编程工具# ai# Codeium# IDE集成
Gummy 创新的语音翻译大模型,它通过端到端的设计和深度学习技术,实现了高质量的实时语音翻译。无论是在国际会议、教育培训、旅游导航还是客户服务和医疗咨询等场景中,Gummy都能提供高... 01180 AIGC开发平台AI开源项目# ai
浪潮云 浪潮云,全球云服务商,作为中国分布式云的引领者,浪潮云致力于成为高品质云服务提供商,具备“专业、生态、可信赖”三大核心优势。为客户提供云网边端融合、云数智融合、建管运融... 01180 AIGC开发平台AI开放平台# ai# 云市场# 云服务
RapidPages 一个开源的集成开发环境(IDE),专注于利用人工智能技术快速生成React和Tailwind CSS的UI组件。 01170 AIGC开发平台AI开源项目# ai# AI驱动# IDE
DiffusionGPT 一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换。 01160 AIGC开发平台AI开源项目# ai# 人类反馈优化# 优势数据库