关于我们
网站声明
联系方式
用户反馈
网站地图
帮助
首页
电报
话题
盯盘
VIP
FM
投研
下载
我的关注
多模态模型
7383关注
多模态通常包含两个或者两个以上的模态形式,使用多模态数据能够使得事物呈现更加立体、全面,多模态研究成为当前研究重要方面,在情感分析、机器翻译、自然语言处理 和生物医药前沿方向取得重大突破。
+ 关注
全部内容
2025-09-19 12:41
【全球首个深度推理+多模态大模型“紫东太初”4.0发布】
《科创板日报》19日讯,全球首个“深度推理+多模态”大模型——“紫东太初”4.0今日在武汉发布。《科创板日报》了解,中科曙光等生态伙伴依托中国首个AI计算开放架构为“紫东太初”4.0提供图文多模态模型训推、大语言模型训推等全链路智能算力支持。(记者 黄心怡)
收藏
阅312.63W
评论
(1)
分享
(7)
微博
微信
2025-09-16 11:58
【Kimi K2官方高速版API开启限时5折特惠】
《科创板日报》16日讯,据Kimi开放平台消息,Kimi K2官方高速版API开启为期一个月的5折特惠。kimi-k2-turbo-preview是Kimi K2模型的高速版,模型参数与kimi-k2-0905一致,已提升至256K上下文。Kimi K2高速版的输出速度达60~100Token/s,是普通版的6倍左右。
收藏
阅264.68W
评论
(1)
分享
(30)
微博
微信
2025-09-01 13:10
【AI应用股震荡走强 视觉中国午后涨停】
财联社9月1日电,视觉中国午后涨停,虹软科技涨超10%,吉视传媒、元隆雅图此前涨停,超讯通信、数码视讯、安诺其、天娱数科、因赛集团等跟涨。消息面上,近日谷歌正式推出了其最先进的图像生成与编辑模型Gemini 2.5 Flash Image,代号“纳米香蕉”(nano banana)。该模型当前在LMArena基准测试中位列AI图像编辑模型榜首,具备角色一致性保持、自然语言精准修图、多图融合能力,并利用Gemini世界知识提升智能表现。
视觉中国
-1.22%
吉视传媒
-4.78%
超讯通信
+1.96%
元隆雅图
-5.34%
安诺其
-2.17%
天娱数科
-3.10%
数码视讯
-0.84%
因赛集团
+1.52%
虹软科技
-4.75%
收藏
阅274.93W
评论
(7)
分享
(103)
微博
微信
2025-09-01 12:40 来自 科创板日报 张真
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
①在最新AI排行榜单中,Nano-banana以1362的分数位列第一,大幅领先于flux和GPT。
②据测试,Nano-banana能够同时驾驭多达13个图片素材,并将其全部融为一张图。
③华泰证券认为,从大模型到多模态已是商业化的必由之路,多模态大模型和应用发展的奇点将至。
收藏
阅100.95W
评论
(12)
分享
(197)
微博
微信
2025-08-07 15:15 来自 财联社 冯轶
短线多重催化利好AI应用前景 港股相关概念股走强宜搜科技涨约10%
①多重催化利好AI应用前景,市场如何看待板块补涨行情?
②港股相关概念股走强,哪些个股业务端已率先受益?
收藏
阅60.54W
评论
(1)
分享
(9)
微博
微信
2025-07-25 08:35
【盘前题材挖掘】
①价格法时隔27年迎来重新修订,“反内卷”政策催化相关板块估值修复。②OpenAI将于8月推出GPT-5,产业链上下游有望迎来全新投资机遇。③钨精矿价格屡创历史新高,机构称钨未来需求有望多点开花。
收藏
阅315.64W
评论
(0)
分享
(55)
微博
微信
2025-07-25 08:28 来自 财联社
OpenAI将于8月推出GPT-5 产业链上下游有望迎来全新投资机遇
①OpenAI据称准备在8月推出新版旗舰大模型GPT-5,并推出mini和nano版本。
②中银证券指出,全球通用大模型的技术标杆将被进一步拉高,倒逼国内厂商(如百度文心、阿里通义等)加速技术迭代以应对竞争差距。
收藏
阅112.56W
评论
(1)
分享
(36)
微博
微信
2025-07-10 13:53
【三星:今年将大幅提升Galaxy AI产品数量】
《科创板日报》10日讯,三星电子移动通信部门总裁卢泰文表示,公司计划年内将搭载“Galaxy AI”功能的移动产品数量从去年的2亿部增至4亿部以上。他预测,现阶段以APP和触控为基础的智能手机将逐步向基于自主智能体和多模态模型的AI设备演进,并朝着更加个性化的方向发展。
收藏
阅281.33W
评论
(0)
分享
(2)
微博
微信
2025-05-17 12:35
【天津:加强核心算法技术研发】
财联社5月17日电,天津市人民政府办公厅印发《天津市促进人工智能创新发展行动方案(2025-2027年)》。其中提出,加强核心算法技术研发。推动前沿基础理论研究,支持自然语言处理、机器视觉、深度学习、感知算法、大模型训练架构等基础算法研究,加强国产开源社区建设。巩固脑机交互技术优势,推动脑机交互与人机共融技术研发应用。推动应用技术研究,支持多模态模型、垂类模型、轻量化模型研发应用,鼓励开源模型的二次开发。支持人机协同、无人驾驶、车路协同、无人机群体智能、虚拟现实(VR)/增强现实(AR)、区块链等场景应用技术的研发。
收藏
阅324.8W
评论
(4)
分享
(87)
微博
微信
2025-05-13 15:23 来自 科创板日报 宋子乔
字节迭代多模态大模型 媲美谷歌新品 智能体能力更强、推理成本更低
①其性能可达到与Gemini 2.5 Pro相当的水平;
②具备更强的通用多模态理解和推理能力;
③已在火山引擎上开放API供用户体验。
收藏
阅82.17W
评论
(8)
分享
(63)
微博
微信
2025-04-29 19:53 来自 界面新闻
【腾讯宣布重构混元大模型研发体系 加大AI投入】
财联社4月29日电,腾讯对其混元大模型研发体系进行了全面重组,主要围绕算力、算法和数据三大核心板块刷新团队部署,加码研发投入。此次调整后,腾讯成立了两个新的部门:大语言模型部和多模态模型部,分别负责探索大语言模型和多模态大模型的前沿技术,持续迭代基础模型,提升模型能力。同时进一步加强大模型数据能力和平台底座建设,其中数据平台部专注大模型数据全流程管理与建设,机器学习平台部则聚焦机器学习与大数据融合平台建设,为AI模型训练推理、大数据业务提供全面高效的PaaS平台底座,共同支撑腾讯混元大模型技术研发。 (界面新闻)
收藏
阅271.82W
评论
(6)
分享
(414)
微博
微信
2025-04-24 12:46
【智谱旗下多款大模型产品降价 其中GLM-4-Plus降价九成】
《科创板日报》24日讯,智谱宣布对旗下多款大模型产品进行价格调整, 其中,GLM-4-Plus降价90%,从50元/百万tokens降至5元/百万tokens(相当于每亿tokens 500元),较行业价格低92%。(记者 李明明)
收藏
阅279.04W
评论
(0)
分享
(45)
微博
微信
2025-04-15 09:48
【月之暗面Kimi发布新模型Kimina-Prover Preview】
《科创板日报》15日讯,今日,月之暗面 Kimi 与 Numina 团队合作开发的数学定理证明模型 Kimina-Prover 推出预览版。据介绍,该模型在数学定理证明基准测试 MiniF2F上取得了80.7%的成绩,超过此前最佳水平 (SOTA)模型10.6%,创下新高。
收藏
阅261.26W
评论
(0)
分享
(4)
微博
微信
2025-04-12 21:46
【OpenAI:GPT-4本月底退役 由4o完全替代】
财联社4月12日电,OpenAI在其网站上表示,从4月30日起,GPT-4将被GPT-4o“完全替代”,但GPT-4将继续通过API提供使用。OpenAI称,“在面对面的评估中,它(4o)在写作、编码、STEM等方面持续超过GPT-4。”据美媒The Verge 10日报道,OpenAI下周将揭晓一系列新的AI模型,其中将包括GPT-4.1, 这将是4o多模态模型的改进版。OpenAI同时还将推出更小的GPT-4.1 mini和nano版本,以及o3“推理”模型和新的名为o4-mini的推理模型。
收藏
阅344.09W
评论
(32)
分享
(1147)
微博
微信
2025-04-10 11:13
【Kimi开源多模态模型Kimi-VL、Kimi-VL-Thinking】
《科创板日报》10日讯,今日,月之暗面Kimi开源轻量级视觉语言模型Kimi-VL和Kimi-VL-Thinking,新模型采用MoE架构,支持128K上下文,激活仅约30亿参数;多模态推理能力在多个基准测试中,超过10倍大小的大模型。
收藏
阅270.3W
评论
(0)
分享
(4)
微博
微信
2025-03-28 09:25 来自 科创板日报 宋子乔
多模态又考验算力了!ChatGPT文生图功能太火爆 奥尔特曼:GPU“冒烟了”
①OpenAI将暂时对ChatGPT生成图片的功能引入一些速率限制;
②让AI生成更精确、更高清的图像依赖于GPU的大规模并行计算;
③OpenAI因新功能面临的问题,折射了AI多模态技术发展中的资源与需求平衡难题。
收藏
阅68.41W
评论
(8)
分享
(145)
微博
微信
2025-03-27 03:34
【通义千问发布新一代端到端旗舰模型Qwen2.5-Omni】
财联社3月27日电,阿里巴巴发布通义千问系列的最新旗舰模型Qwen2.5-Omni。这款端到端多模态模型专为广泛的多模态感知设计,能够处理文本、图像、音频和视频等多种输入,同时能够通过生成文本和合成语音提供实时流式响应。
收藏
阅285.77W
评论
(0)
分享
(76)
微博
微信
2025-03-19 14:38 来自 36氪
【群核科技开源空间理解多模态模型 可用于具身智能训练等领域】
财联社3月19日电,在GTC2025全球大会上,群核科技宣布开源其自主研发的空间理解模型SpatialLM。该模型仅通过一段视频即可生成物理正确的3D场景布局。据了解,SpatialLM突破了传统大语言模型对物理世界几何与空间关系的理解局限,让机器具备空间认知与推理能力,将为具身智能等相关领域提供空间理解基础训练框架。此外,该模型接下来还将迭代自然语言和场景交互功能。 (36氪)
收藏
阅267.07W
评论
(0)
分享
(41)
微博
微信
2025-03-03 09:01
【智谱预告今年将全系列开源】
《科创板日报》3日讯,《科创板日报》记者今日获悉,2025年将是国内大模型独角兽智谱的开源年,其很快会发布全新大模型(包括基座模型、推理模型、多模态模型、Agent等),并将其开源。(记者 李明明)
收藏
阅261.03W
评论
(0)
分享
(50)
微博
微信
2025-02-26 09:29
【文生视频概念股开盘走强 当虹科技涨超10%】
财联社2月26日电,当虹科技涨超10%,万兴科技、开普云、华策影视、因赛集团、虹软科技、中广天择、华扬联众等跟涨。消息面上,阿里巴巴于昨日晚间全面开源旗下视频生成模型万相2.1模型,视频生成、图像生成两大能力均获得提升。
收藏
阅260.57W
评论
(3)
分享
(58)
微博
微信
加载更多
热门话题推荐