DeepSeek概念股是指那些可能从DeepSeek公司的人工智能技术和产品中获得直接或间接利益的企业。随着DeepSeek在大型语言模型、机器学习等AI前沿领域的持续突破,其技术成果有望在多个方面产生广泛影响,相关的行业如IT服务、云运算、大数据、应用软件等。
暂无内容
中国电信柯瑞文:全面深入实施云改数转战略 把握人工智能发展趋势
TechWeb04/30 04:25 (美东)
小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview
华尔街见闻04/30 00:00 (美东)
Canalys:第一季度全球智能手机市场仅实现0.2%的增长 出货量达2.969亿台
智通财经04/29 23:10 (美东)
阿里发布Qwen3后,马斯克宣布下周推出Grok 3.5
TechWeb04/29 22:06 (美东)
全球芯片战争新变数!特朗普准备放大招
金十数据04/29 19:47 (美东)
中国人形机器人,抢占全球5万亿美元“大赛道”!
华尔街见闻04/29 08:19 (美东)
Moriarty mcG 楼主 : 小米最近发布了MiMo,这是其首个开源的大型语言模型(LLM),专为推理任务设计,宣布于2025年4月30日。以下是基于可用信息的详细分解:什么是MiMo?MiMo(可能代表“有意识模型”或类似术语,尽管并未明确说明)是一个拥有70亿参数的LLM系列,由小米的LLM核心团队从头开始训练,专注于数学、编码和一般推理任务。通过预训练和后训练(强化学习,或RL)优化,以增强推理能力。MiMo-70亿系列包括:MiMo-70亿.Base:在约25万亿个标记上进行了预训练,采用多标记预测目标,以提高性能和推理速度。MiMo-70亿.SFT:经过监督微调的版本。MiMo-70亿.RL:从基础模型中通过RL调整,在数学和编码方面表现出色。MiMo-70亿.RL-Zero:从冷启动的监督微调模型中进行RL训练,在特定基准上达到了93.6%的成绩。性能尽管体积紧凑(70亿参数),MiMo在性能上优于更大的模型,如OpenAI的封闭源o1-mini和阿里巴巴的Qwen-320亿。在关键基准(如AIME24、AIME25、LiveCodeBench、MATH500、GPQA-金刚石)上的预览。例如,MiMo-70亿.RL在数学和编码任务上与o1-mini的表现持平。它使用三阶段的预训练数据混合和RL,结合了13万个经过筛选的数学/编码问题,通过基于规则的系统验证以确保质量。测试难度驱动的奖励系统和数据重采样增强了其优化。可用性MiMo是开源的,模型可在Hugging Face(https://huggingface.co/XiaomiMiMo)上获取。小米通过一个分支版本的vLLM支持推理,尽管与其他引擎的兼容性尚未验证。团队欢迎对mimo@xiaomi.com的贡献和反馈。发布包括所有模型变体的检查点,旨在为更广泛的人工智能社区提供构建以推理为重点的LLM的洞见。重要性MiMo标志着小米进入竞争激烈的人工智能领域,展示了其超越硬件的雄心。社交媒体上的帖子突出其紧凑效率和卓越性能,赞扬小米在开源人工智能方面的创新。与专有模型不同,MiMo的开源特性使开发人员和研究人员能够适应和基于此进行构建,可能加速针对推理为重点的人工智能应用的进步。
Saywallahcuzzy : 我想我需要看跌更多的钱在这个我不在乎晨星对它的看法
TheAugustBull八月牛 : 很猛呀!
M55 : 还需要等待关税结束去进腾讯吗
包包的粉粉 : 强 谢谢包包推荐 爱你
旋风小子 : 一如即往(的吗)
cswong9696 : Call吗?姐
查看更多评论...