AI资讯
FramePack 降低 AI 视频生成硬件门槛,6GB 显存即可生成 60 秒视频
FramePack 是一项由 GitHub 和斯坦福大学合作推出的技术,旨在降低 AI 视频生成的硬件门槛。通过固定长度的时域上下文优化视频扩散模型,用户仅需 6GB 显存即可生成高达 60 秒的高质量视频。这一创新显著提高了处理效率,使得在较低硬件配置下生成更长、更高质量的 AI 视频成为可能。
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/ca14499d-d781-4f62-9faf-dcef79fab776.jpg)
FramePack 的核心优势在于利用多阶段优化技术,有效降低了本地运行 AI 视频生成任务对硬件的要求。该技术的图形用户界面(GUI)内部运行的是一个定制的模型,研究论文指出,现有的预训练模型也可以通过 FramePack 技术进行微调以适配该架构。
传统的视频扩散模型在生成视频时,通常需要处理先前生成的所有带噪帧数据来预测下一个噪声更少的帧。FramePack 通过根据帧的重要性对其进行压缩,汇集到一个固定大小的上下文长度内,从而极大地降低了 GPU 的显存开销。
此外,FramePack 还结合了缓解“漂移”现象的技术,支持生成更长的视频内容而不显著牺牲保真度。当前,FramePack 明确要求使用支持 FP16 和 BF16 数据格式的英伟达 RTX 30、40 或 50 系列 GPU,Linux 操作系统已确认在支持列表之中。
以 RTX 4090 为例,在启用 teacache 优化后,生成速度可达约每秒 0.6 帧。FramePack 的出现为普通消费者进行 AI 视频创作铺平了道路,提供了一种替代昂贵第三方云服务的可行方案,尤其适合制作 GIF 动图和表情包等娱乐内容。
AI资讯
科创板人工智能:下一个投资风口?
聚焦科创人工智能,把握核心赛道。
近期,全球市场因关税政策调整陷入震荡,科技板块的波动尤为明显。在这一背景下,中国人工智能产业虽然经历了一轮回调,但却展现出了强劲的韧性与增长潜力。
一方面,关税政策可能对部分传统制造业产生了冲击,但另一方面,也促使各国加快科技自主创新的步伐,特别是在人工智能这一战略性新兴产业中。科创板作为中国科技创新企业的前沿阵地,更是成为人工智能产业发展的核心驱动力。
人工智能蓬勃发展,行业变革加速
尽管关税政策调整带来挑战,但中国人工智能产业已今非昔比。如今,我国已形成“算力—模型—应用”的完整闭环。
在算力层面,国家“东数西算”工程构建了覆盖京津冀、长三角等八大枢纽节点的算力网络,实现全国一体化算力布局。
在模型层面,以DeepSeek为代表,通过算法优化降低对高端GPU的依赖,还能以低成本助力大规模企业接入。
在应用层面,已有几百家企业接入DeepSeek,广泛覆盖金融、能源、物流、机器人等行业。尤其是在机器人领域,AI应用取得重大突破,人形机器人技术加速演进,已然成为科技竞争新高地、未来产业新赛道、经济发展新引擎。
从全球视角来看,人工智能也是未来十年经济增长的重要动能,有望成为对未来十年全球经济增长贡献最多的通用型技术。
聚焦科创人工智能,把握核心赛道
在此背景下,上证科创板人工智能指数成为投资者重点关注的对象,该指数选样范围涵盖科创板人工智能领域上市公司,涉及人工智能的基础资源、技术支持、应用等多个关键领域。
把握AI新机遇,科创工具助力布局
当前,随着一级市场和产业资本持续加大对人工智能的投入,AI算力营收和利润高速增长,AI应用在复杂场景实现降本增效,国内AI应用产品力和用户数量持续提升,科创板人工智能产业正迎来快速发展的黄金时期。
展望未来,人工智能的发展前景依然广阔。随着技术的不断进步和应用场景的持续拓展,人工智能有望在更多领域实现突破,进一步提升生产力和效率。
AI资讯
黄仁勋5000亿豪赌:AI超算首次Made in USA
英伟达宣布将首次在美国制造AI超级计算机,计划通过与台积电、富士康等公司合作,打造价值5000亿美元的AI基础设施。英伟达在亚利桑那州凤凰城的台积电工厂已经开始生产Blackwell芯片,并且在德克萨斯州富士康和纬创资通工厂将进行AI超级计算机的生产。这项大规模的制造计划,旨在提升美国在AI芯片和超级计算机领域的竞争力和供应链韧性。虽然这项计划可能面临技术和贸易方面的挑战,但英伟达的合作伙伴包括安靠(Amkor)和矽品(SPIL)等公司,这些企业将提供芯片封装和测试服务。英伟达表示,未来几年将为美国创造大量就业机会,并推动数万亿美元的经济活动。尽管有贸易政策的不确定性,英伟达的目标是增强美国本土的制造能力,并响应政府推动本土制造的号召。
"Image 7" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_15da75d14fd3439c92ad0654c112a054@5888275_oswg836192oswg1080oswg698_img_000.jpg)
尽管美国本土制造面临技术瓶颈,但英伟达依然在积极推动国内制造,并通过数字孪生和机器人技术来实现自动化生产。
"Image 8" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_f71906da9fe54d63b3765761efe5bed9@5888275_oswg400106oswg1080oswg716_img_000.jpg)
英伟达计划在未来12至15个月内开启大规模生产,并且继续投资制造设施以满足AI芯片和超级计算机市场的需求。
"Image 9" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_b71dccb1d712478f8aedcc5e1d41cc8e@5888275_oswg312316oswg1080oswg608_img_000.jpg)
然而,外部的贸易制裁以及美国政府的政策变动,可能会对计划的实施带来不确定性。英伟达与其他科技公司一样,正在面临中美贸易冲突中的挑战。
"Image 10" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_01dfa128560644b6a8789c477468e9df@5888275_oswg425183oswg1080oswg566_img_000.jpg)
AI资讯
一台iPhone卖25588元,美国制造的代价有多高?
最近几天,美国股市受到特朗普关税政策的影响,造成科技股暴跌,尤其是苹果公司受到了严重影响。苹果的供应链涉及多个国家,中国是其重要的生产和组装地,而这次的关税政策让苹果的生产成本急剧上升。美国的关税政策将苹果的供应链成本推高,苹果不得不采取措施,在关税生效前空运大量手机库存。
这次关税的影响不仅体现在生产成本的增加,还暴露了美国制造业的局限性。如果iPhone完全在美国生产,售价可能会飙升到3500美元。关税政策直接影响了中国大陆的组装环节及核心零部件,尤其是富士康、和硕等公司,他们的利润率微薄,因此受到极大压力。
在讨论美国制造业的成本时,劳动成本成为最关键的一项。美国的劳动成本远高于中国,这使得苹果的利润面临巨大压力。此外,缺乏足够的原材料供应和高昂的物流成本也增加了美国制造业的成本,导致即使在关税豁免后,生产成本仍然居高不下。
在这个背景下,苹果面临着两难的局面:一方面是巨大的生产成本,另一方面是消费市场对价格敏感度的增加,苹果的利润可能因此受到严重影响。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_b9c02005a9234dc4aad985f6222399d5@000000_oswg360866oswg1080oswg1080_img_000.jpg)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_acb4b63b24284d36b25249f88b4e3195@000000_oswg413699oswg931oswg596_img_000.jpg)
"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_c9ec8660ab134ea2bc10dba19b0df611@000000_oswg889184oswg1080oswg716_img_000.jpg)
"Image 4" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_d9359e725cae4c2295df4cf3e6cf369a@000000_oswg212793oswg605oswg345_img_000.jpg)
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_7b2be87e27024fa1bfce10cc62ef3aac@000000_oswg891051oswg1080oswg716_img_000.jpg)
"Image 6" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_add8b563bb904617a22a3bbdfecc6955@000000_oswg235936oswg1080oswg720_img_000.jpg)
"Image 7" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_1abcfef5b6fd46bdabcc8d73f7a61b01@000000_oswg933324oswg1080oswg608_img_000.jpg)
"Image 8" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_f9ac98e83f0b4883bef15b42d12ece16@000000_oswg293619oswg836oswg516_img_000.jpg)
"Image 9" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_8c639dd6224d4b2eb6ba7e0e80b31087@000000_oswg59435oswg1080oswg630_img_000.jpg)
AI资讯
大模型六小龙,第一个IPO要来了
国内大模型赛道出现了第一家启动 IPO 的创业公司——智谱华章科技。4 月 15 日,中国证监会公开发行辅导公示显示,智谱已启动 IPO 流程,预计将在今年 8 月至 10 月完成辅导计划。智谱成立于 2019 年,脱胎于清华大学,由唐杰教授领导,专注于打造新一代认知智能通用模型。智谱通过多轮融资成功吸引了大量资本支持,包括美团、蚂蚁集团、腾讯等。
智谱的技术发展突飞猛进,涵盖了千亿基座模型、对话模型、代码模型及多模态智能体等领域。其 GLM 系列大模型在基础研究和商业化方面均取得了突破,尤其是推出了多个具有里程碑意义的模型,如 GLM-10B、悟道、GLM-130B 等。
智谱的未来发展方向包括推出全新大模型并开源,进一步推动国产大模型生态的建设。其计划在未来五年内推动超过1000家企业的AI转型,并孵化出20家生态企业,促进大模型应用和技术革新。
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_7190534f633f4b61b2453a89ab176835@000000_oswg348855oswg1080oswg846_img_000.jpg)
"Image 6" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_5f93f6bc3ab644c0a2faa5ec89499483@000000_oswg149523oswg1080oswg512_img_000.jpg)
AI资讯
阻止意义的崩塌
很多人会问,AI的发展是否意味着人类在某些领域的存在意义已经失去了价值?柯洁曾在一次直播中表示,AI已经让人类棋手的价值显得微不足道。他与AlphaGo的对弈并未让他感受到人类智慧的不可替代性,反而加深了人类在许多领域被取代的恐惧。这不仅仅是围棋领域的冲击,AI在医学、艺术等领域的表现同样令人惊叹,给各行业带来了巨大的挑战。
AI引发的意义危机
AI的崛起不仅在技术层面对人类产生了冲击,也加剧了人类对于自己存在价值的质疑。历史上,工业革命导致了劳动异化的危机,人类从自然界的主宰者逐渐变成了被工具和机器支配的“工具人”。AI技术的崛起,尤其是在医学诊断和艺术创作中的突破,使得“工具人”的危机愈加严重。这种意义危机深刻影响着人类对自我存在的认知。
人类与AI的关系
有些学者认为AI可能会成为超越人类的存在。杰夫·辛顿等忧虑派专家认为,AI在未来30年内可能会给人类带来灭绝的威胁,而其他人则认为AI是增强人类智慧的工具,应当通过开源和公平的财富分配来避免AI带来的负面影响。尽管如此,大多数专家仍然认为,AI的出现并不会完全取代人类,而是会成为人类智慧的延伸工具。
AI对劳动和工作的影响
随着AI的发展,尤其是在白领工作领域,AI有可能在未来取代大量的办公室工作。像法律、财务分析等领域的任务都可以通过AI自动化完成,这让大量的白领职场面临巨大的挑战。然而,AI的出现并非全是负面影响,它也创造了新的职业和机会。未来的工作结构将面临重构,AI可能让人类重新审视“工作”和“劳动”的价值。
技术增强与技术奴役
随着技术的进步,AI不仅仅是一个工具,也可能成为新的霸权力量。人类必须小心技术的过度依赖,避免在追求效率和生产力的过程中失去自我。科技的进步可能让人类在某些方面变得更加依赖于技术,甚至沦为工具的奴隶。因此,如何平衡工具理性和价值理性,如何保持人类的创造力和自由意志,将是未来社会的关键课题。
AI的未来充满未知,正如科幻作品所描绘的那样,AI可能会从人类的盟友转变为统治者。人类必须确保在与AI共存的过程中,始终保持对自己认知过程的反思和控制。
AI资讯
DeepSeek红利耗尽
DeepSeek的红利逐渐消退,元宝和豆包在AI应用市场中的竞争愈发激烈。随着市场需求的变化,元宝虽然借助DeepSeek的力量一度领先,但其产品力未能持续占优,反而被豆包超越。豆包在产品设计和功能丰富度方面的领先,尤其是在深度思考能力和搜索功能上的整合,使其获得了更强的市场粘性。元宝尽管在加快更新频率,但在用户需求和技术创新方面仍显不足。
竞争态势的变化
在短短60天内,中国区苹果应用商店的AI原生应用排名发生了大幅波动,豆包再次超越DeepSeek,元宝滑落至第七名。通过AI产品的不断更新和调整,豆包逐渐占据了市场的领先地位,尤其是在与抖音的深度联动后,增强了其用户的活跃度和粘性。
元宝的反应
在产品更新方面,元宝采用了频繁的更新策略。自从接入DeepSeek后,元宝加速了版本更新的速度,但在智能助手和基础功能的调整上仍显滞后。用户在下载元宝后,曾无法找到智能体的身影,显示出元宝在产品迭代上的不稳定。
深度思考与产品设计
元宝和豆包在深度思考能力的模型差异上表现出截然不同的路径。元宝注重推理模型的响应速度,而豆包则强调答案的精准度。此外,豆包的抖音联动策略,通过扩大抖音消息列表中的内测范围,进一步吸引了大量用户下载和使用其APP,强化了豆包的市场竞争力。
市场前景
尽管元宝在技术更新上加速了脚步,但与豆包的差距仍然存在。特别是在产品设计和用户体验的深度整合上,豆包的领先优势仍然明显。未来,随着AI应用的技术不断成熟,元宝和豆包的较量可能会迎来更多变数,挑战也会继续催生新的竞争空间。
AI资讯
亚裔小哥F翻大厂
Roy Lee,一名哥伦比亚大学的大二学生,因自制面试作弊器并通过亚马逊、Meta、TikTok等公司的面试而受到广泛关注。他不仅公开录制了作弊过程的视频,还公开了学校对他的纪律处分邮件,拒绝了亚马逊的Offer。Roy的行为引发了公众对传统技术面试的质疑,并且他创造的作弊工具“Interview Coder”被广泛讨论。
Roy通过自制的作弊器‘Interview Coder’,利用AI(如ChatGPT)帮助解答面试题,这一行为引发了亚马逊等大厂的强烈反应。尽管他的行为被视为作弊,但他坚决拒绝回归哥伦比亚大学,反而将自己的经历公开,成为一些人眼中的反叛英雄。
Roy的故事不仅挑战了传统的技术面试体系,也激起了对编程教育和招聘制度改革的讨论。尽管他被哥大停学一年,亚马逊也撤回了Offer,但Roy并未因此止步。他公开表示将继续创业,注册了自己的公司并通过‘Interview Coder’获利。这一切让人们开始反思科技大厂的招聘方式,特别是在AI浪潮下,传统的编程技能是否过时。
他的经历吸引了大量支持者与批评者,大家纷纷对他是否真正挑战了现有体制表示看法。无论他是“作弊者”还是“英雄”,他都凭借自己的方式引起了科技行业的广泛讨论。在这种背景下,Roy似乎并不打算停下来,反而希望通过自己的反叛精神继续前行。
在对传统招聘流程的挑战中,Roy不仅成为了技术面试“死板性”的代名词,也为AI和技术教育的未来发展提出了新问题。
AI资讯
智谱AI启动上市
智谱AI启动上市,成为首家启动IPO的"大模型六小虎",估值超过200亿。在正式启动上市的同一天,智谱AI宣布将开源32B/9B系列GLM模型,并启用全新域名“z.ai”。
智谱AI成立于2019年,脱胎于清华KEG(知识工程实验室)。自2020年以来,公司研发了多个具有突破性的人工智能大模型,包括百亿参数模型GLM-10B和千亿级别的GLM-130B。最新的GLM-4基座大模型和视觉模型GLM-4V-9B在技术上媲美GPT-4V,展示了智谱AI在多模态AI技术上的强大能力。
2025年3月,智谱AI发布了首个支持深度研究与实际操作的智能体AutoGLM沉思,并称其能够推动AI Agent技术进入“边想边干”的阶段。同时,智谱AI还发布了能生成汉字的文生图模型CogView4,这一模型在多个基准测试中排名领先,表现出极高的技术水平。
此外,智谱AI在与多个地方政府达成合作后,获得了战略融资支持,并计划在多个城市建立AI基础设施,进一步推进人工智能产业的发展。例如,珠海和成都已分别投资5亿元和3亿元,助力智谱AI加速技术创新与大模型应用的落地。
智谱AI的未来发展包括持续开源模型以及推动AI在不同领域的应用,尤其是在政府服务、教育和金融等多个行业场景中,力求在更广泛的应用中实现技术价值。
AI资讯
“大模型六小龙”第一家,智谱启动 IPO 流程
智谱华章,作为“国产大模型六小龙”之一,正式启动了IPO流程,成为首家启动这一流程的大模型公司。该公司成立于2019年,源自清华大学的技术成果,致力于新一代认知智能大模型的研发,并专注于中国创新的推动。智谱已发布多个大模型产品,其中包括2021年发布的GLM-10B和2025年发布的GLM-Realtime。该公司最近完成了数十亿元人民币的融资。
智谱的业务核心集中在大模型领域,特别是在AI应用的深度学习模型上。此次IPO的启动标志着其进一步扩展和市场化的步骤,同时也展示了国产大模型在全球AI竞争中的崛起。智谱的融资和技术进展都展示了其作为AI领域重要创新力量的潜力。
此外,智谱也宣布其新的端到端模型GLM-Realtime支持清唱、2分钟记忆及功能调用,为AI应用提供更多创新性的解决方案。
https://img.ithome.com/newsuploadfiles/2025/4/6fa925ef-349c-4f61-ba97-7a74a3f856be.jpg?x-bce-process=image/quality,q_75/format,f_webp
智谱此次的工商变更也显示出其在公司结构和市场战略上的调整,为其后续的IPO和上市做好了充分准备。
AI资讯
AI应用玩转新模式
2025年上海AI应用创新大会即将于4月18日举行,聚焦Super APP等创新应用。AI不仅在数字世界中发挥作用,还逐步走入我们的日常生活,成为我们的“潮鞋大师”、“职场外挂”和“脑洞制造机”。从AI潮鞋到AI眼镜,AI应用正以前所未有的方式刷新着人们对未来的认知。以下是几项最具创新性的AI应用案例:
1. AI生成PPT工具:AiPPT.com提供“一句话生成PPT”的功能,使职场人士能快速生成专业的PPT,无论是新手还是老手都能轻松上手。
"PPT工具" (https://img.36krcdn.com/hsossms/20250415/v2_9b005ef8d50645c8a6b9190174728d5e@5868219_oswg10488oswg430oswg430_img_000?x-oss-process=image/format,jpg/format,jpg/interlace,1)
该工具适配各种行业,支持多种格式转换,确保工作效率和数据安全。
2. 闪极AI「拍拍镜」:这款眼镜不仅能够拍摄和录像,还支持文字翻译、公式识别和解题分析,展现了AI在物理世界中的巨大潜力。
"拍拍镜" (https://img.36krcdn.com/hsossms/20250415/v2_e980a4aded434e9796ba0059c582eeb2@5868219_oswg4370oswg430oswg430_img_000?x-oss-process=image/format,jpg/format,jpg/interlace,1)
3. 智能审讯系统:通过分析嫌疑人的表情、语音和生理信号,系统可以辅助警方进行更加精准的审讯。
"智能审讯" (https://img.36krcdn.com/hsossms/20250415/v2_8aeae4c835d349d39ce3278412606a57@5868219_oswg19422oswg430oswg430_img_000?x-oss-process=image/format,jpg/format,jpg/interlace,1)
4. AI设计鞋履:Vali鞋履AI工具可以根据输入的要求,在短短10秒钟内生成多款设计图,极大提高设计效率。
"鞋履设计" (https://img.36krcdn.com/hsossms/20250415/v2_0010e6b2eff94f808a654d4362840397@5868219_oswg18666oswg430oswg430_img_000?x-oss-process=image/format,jpg/format,jpg/interlace,1)
这些创新AI应用不仅是技术的突破,更是生活方式的革命,它们展示了AI在各行各业的无限可能。
AI资讯
开源版GPT-4o来了
近期,HiDream-I1,一款开源且商用的图像生成模型,以其出色的生成能力成为国内图像生成技术的佼佼者。其在图像真实感和细节呈现上与GPT-4o相媲美,甚至在某些场景下表现得更加细腻。HiDream-I1不仅能生成高质量的图像,还具有强大的指令遵循能力,能够根据复杂的提示词生成精细且符合物理规律的图像。通过与其他模型如Flux和GPT-4o的对比,HiDream-I1的图像生成效果在细节和色彩层次上有着明显优势。除此之外,HiDream-I1的开源特性和商用许可为开发者和公司提供了广泛的应用场景,特别是在图像生成和编辑领域。随着智象未来公司对其进行不断优化和扩展,HiDream系列模型在国内外的影响力持续增强。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_d56c4567deab4adabe07780131869987@000000_oswg319460oswg974oswg1311_img_000.jpg)
模型性能的提升得益于其采用了先进的技术架构,如Sparse Diffusion Transformer(Sparse DiT)架构与Sparse Mixture-of-Expert技术。这些技术使得HiDream-I1能够在性能和计算效率之间找到平衡,为开发者提供了高性价比的解决方案。与此同时,生成对抗学习(GAN)技术的加入进一步提高了图像的清晰度和细节,还加快了生成速度。智象未来计划将HiDream-I1的技术应用扩展到更广泛的图像编辑领域,推出了HiDream-E1模型,带来了类似GPT-4o的交互式图像编辑体验,填补了开源领域的空白。
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_f71b7290b44e4c42b2390ccd55e0f395@000000_oswg1169795oswg1080oswg1256_img_000.jpg)
HiDream-I1的开源和商用化,为国内外企业和个人开发者提供了巨大的潜力,推动了AI图像生成技术的发展。智象未来公司在不断推动技术创新的同时,也积极提升其国际影响力。
AI资讯
AI大爆炸
AI(人工智能)已经渗透到我们生活的方方面面,从语音助手到自动驾驶汽车,AI正在以惊人的速度改变我们的世界。\n\nAI的历史\n---\n一、人工智能的诞生(20世纪中叶)\n1950年,艾伦·图灵提出了“图灵测试”,定义了人工智能的哲学目标。1956年,达特茅斯学院首次使用“人工智能”一词,AI正式成为应用技术。\n\n二、符号主义的失败(1960-1970)\n这一时期的AI主要依赖规则库模拟人类推理,尽管在医疗诊断等领域取得了一定成就,但技术局限性导致了“AI冬天”。\n\n三、AI机器学习崛起(1990s-2000s)\n90年代,机器学习通过概率统计模型取代了符号主义方法,AI技术逐渐实现商业化。\n\n四、AI深度学习革命(2010s-2020)\n深度学习通过多层神经网络自动提取特征,使AI能够处理复杂数据,推动了AI技术的快速发展。\n\n五、AI大模型时代(2021至今)\n大规模预训练模型的出现,推动AI朝着通用智能的方向不断迈进,生成式AI在多个领域展现出巨大的应用潜力。\n\n未来展望\nAI将向“精而专”转变,催生“企业智能体”的崛起,推动企业决策与创新的高效运转。
AI资讯
双生进化论:AI时代下的应用生态重构
真正的“AI原生游戏”落地尚早。如何做出真正的“AI游戏”,是大多数公司仍在思考的问题。随着《Whispers from the Star》游戏的公开,行业对AI游戏的关注和讨论再次升温。这款游戏由米哈游创始人蔡浩宇创立的Aunttacon公司开发,采用了多模态AI技术,能够处理玩家语音、文字等多个输入方式,推动游戏内容和结局的多样化。这种AI技术使玩家能够与游戏中的角色进行互动,形成个性化的游戏体验。
不过,尽管技术不断进步,很多业内人士认为目前的AI游戏仍然主要是营销噱头,并未完全落地。行业数据显示,近80%的头部游戏公司已经开始布局AI、数字孪生、云技术等领域,但真正的AI游戏还面临许多挑战。AI在游戏中的应用目前更多是作为降本增效的工具,而真正的“AI原生游戏”仍需要进一步探索。2024年初,Steam平台也开始允许AI生成内容的游戏上架,表明行业对AI的接受度有所提高。
AI游戏的未来仍充满不确定性。虽然有一些创新项目,例如《1001夜》和《Whispers from the Star》,也有公司在现有游戏中融入AI元素,但如何满足玩家需求,确保游戏质量仍是最大挑战。即使AI能够生成丰富的剧情内容,许多开发者依然认为,AI无法完全替代真人玩家的互动与参与。
在技术层面,AI原生游戏仍需要考虑模型能力、稳定性和算力成本等因素,并且游戏设计的可控性和稳定性尚未得到验证。尽管如此,许多游戏公司对AI原生游戏充满希望,认为这是突破行业瓶颈的一条新路径。未来,随着技术的成熟,AI原生游戏有望实现更加开放与自由的RPG游戏形态,吸引更多玩家的参与。
AI资讯
“大模型六小虎”首个IPO,来了
近日,智谱华章科技发布了新一代的开源推理模型GLM-4-32B-0414,该模型凭借320亿个参数,性能接近671B参数的DeepSeek-V3/R1。该模型现已免费开放,用户可以在平台z.ai体验。GLM-4-32B-0414支持多种功能,包括代码生成、网页设计、动画绘制等。智谱还推出了多个版本的推理模型,包括免费的GLM-Z1-Flash、极速版的GLM-Z1-AirX,以及高性价比的GLM-Z1-Air,提供不同的API定价方案。智谱的推理模型在性能和性价比上具备较强的竞争力,预计将推动AI技术的普及与创新。开源的推进不仅降低了开发者的使用门槛,还促进了技术创新的扩散,预计会对AI产业的未来发展产生深远影响。
图片链接:
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_3f10023145a447ad993e0eff4cff1f9d@000000_oswg224651oswg900oswg383_img_000.jpg)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_e9529561ba6149848ddc28e8c0455a73@000000_oswg192960oswg1000oswg1005_img_000.jpg)
"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_d6a98cf945334659859c1c3d814665b3@000000_oswg267558oswg1000oswg942_img_000.jpg)
"Image 4" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_c3d1ae1f6ee8460a99889132fd40ebd4@000000_oswg424701oswg1000oswg477_img_000.jpg)
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_7c03fdd17dd44f9895a8519d016306db@000000_oswg27985oswg1000oswg467_img_000.jpg)
"Image 6" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_5ecf9062f8794442803c33b4a6b60d8c@000000_oswg30531oswg1000oswg338_img_000.jpg)
"Image 7" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_f98510ba996b405596c214c7578d5370@000000_oswg174259oswg1000oswg526_img_000.jpg)
"Image 8" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_e5f4c6bd1a02451dac70808b5108afcb@000000_oswg125010oswg1000oswg469_img_000.jpg)
"Image 9" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_e76ff231070a459b846aaced10d44bf4@000000_img_000.jpg)
"Image 10" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_0f9d8d345db54782a2fad0403d329ab6@000000_oswg263570oswg1000oswg757_img_000.jpg)
"Image 11" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_cc5e9b3869d542fd84a85c00f3947828@000000_oswg126095oswg1000oswg557_img_000.jpg)
"Image 12" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_c33ea48cc1ea4ba7b1ff5e04935a6e7e@000000_oswg132292oswg1000oswg636_img_000.jpg)
"Image 13" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_26e3d358dc52456095da1fe23d4c6adc@000000_oswg188183oswg1000oswg821_img_000.jpg)
"Image 14" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_131cdd3e75b54bd392c53b1e3c4c2f2d@000000_oswg148034oswg1000oswg467_img_000.jpg)
"Image 15" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_da789c3aa3394913be3efd6373a0da05@000000_oswg122520oswg1000oswg468_img_000.jpg)
"Image 16" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_c0b8e0e947e54fb2bfe7a56d2550935e@000000_oswg167794oswg1000oswg546_img_000.jpg)
"Image 17" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_0e7bdbb33fba44e9a04fc74ee89680f4@000000_oswg263110oswg1000oswg697_img_000.jpg)
"Image 18" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_e118091cf1db42dcacf7c1fff04315ec@000000_oswg291468oswg1000oswg697_img_000.jpg)
AI资讯
QuestMobile2025第一季度AI应用市场竞争分析:行业格局全颠覆,DeepSeek、豆包、腾讯元宝位居TOP3
今天分享的是AI应用市场的发展现状。根据QuestMobile数据显示,到2025年2月底,AI原生APP的用户规模已达到2.4亿,较1月增长了1.15亿,增幅为88.9%。与此同时,用户的使用黏性也显著提高,2月份的月人均使用时长和次数分别达到113.7分钟和52.4次。DeepSeek的崛起成为这一变化的核心,尤其是在AI开源普惠效应的影响下,互联网的头部企业纷纷加速布局,带来了AI应用市场的大规模震荡。AI应用领域正加速进入“多模型驱动”时代,AI综合助手、AI搜索引擎等赛道成为市场中的主要竞争焦点。
原生AI应用市场的格局发生了剧变,尤其是DeepSeek,豆包和腾讯元宝等应用成为新的行业领导者,原有的行业格局被彻底打破。这一趋势不仅是AI技术的普及,更推动了行业基础设施的快速完善和标准化进程的加速,带来的是AI应用的爆发性增长。特别是在AI搜索和多模型驱动的推动下,各大应用的核心竞争点已从基础功能扩展到产品设计和运营能力的比拼。
随着AI原生App在国内外市场的快速拓展,AI应用的未来将涵盖包括智能助手、搜索引擎、图像处理、文案写作等在内的多个赛道。DeepSeek的成功不仅带动了AI应用的增长,也使得行业巨头不得不调整策略,以应对这一新兴市场带来的激烈竞争。
图片链接:
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_277e570d407449f58845634dd398932d@000000_oswg87276oswg960oswg656_img_000.jpg)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_081e0c4a30404e958c2771686f6bd9b2@000000_oswg129707oswg960oswg612_img_000.jpg)
"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_3492a4985f2645ff920f76becd8d5de5@000000_oswg97351oswg960oswg600_img_000.jpg)
"Image 4" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_67586b2ed62f4a43b84cbdf6b0ffc783@000000_oswg85012oswg960oswg610_img_000.jpg)
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_c2c7a87545a5497b90432f99f48e3a1e@000000_oswg115800oswg960oswg574_img_000.jpg)
AI资讯
“AI 六小虎”首个 IPO 来了,大模型狂奔两年后,开源成“唯一出路”
“AI 六小虎”是过去两年国内大模型时代的一个标志,指的是当年最早完成 10 亿 + 美元融资,且均拥有自研千亿参数级大模型,在国际基准测试中与 GPT-4、Llama 等对标的大模型创业公司。
随着六家公司分化出各自不同的道路,AI 六小虎象征的意义发生了变化。过去两年,国内大模型公司围绕模型层、产品层和营销层展开了较量,技术分享、产品应用和知名度逐渐成为各大公司的竞争焦点。
2023年,百川智能、阶跃星辰、零一万物、月之暗面和DeepSeek等公司相继成立,至今大多已实现了千亿参数模型的发布,表明大模型的竞争并未因参数规模的停滞而结束。
然而,大模型公司的最大挑战在于算力的持续投入和高端人才的需求。基座模型的盈利周期较长,且市场对创新性、成本控制和战略方向的要求日益增加。
DeepSeek通过极具性价比的推理模型突破了竞争壁垒,成为行业的佼佼者,其开源与低成本的优势促使行业参与者重新评估自己的发展策略。
随着“AI 六小虎”分化,更多公司开始专注于垂直领域,如百川智能聚焦医疗领域,零一万物则专注于轻量级模型。虽然整体市场竞争激烈,仍有公司坚持进行大模型研发,尝试创新突破。
AI 六小虎的分化,为大厂如阿里、字节和腾讯提供了追赶的机会,他们积极布局大模型,争取抢占市场。
目前,AI 六小虎正面临着闭源与开源的选择,尤其在资金、计算能力和数据方面的限制下,开源已成为他们的“唯一出路”。开源不仅降低了技术门槛,还为更多企业提供了合作的机会,推动了整个生态的共同发展。
商业化是大模型企业未来的重要方向,虽然短期内面临许多挑战,但随着技术的逐步发展和市场的成熟,AI 六小虎仍需通过差异化的产品和战略决策来实现突破,迎接未来的竞争与机遇。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_ee28c3afcd8847cfbeafafe6457d4059@000000_oswg236993oswg1080oswg381_img_000.jpg)
AI资讯
苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进
苹果公司在4月14日发布了一篇博文,详细介绍了其AI隐私保护核心技术,其中包括差分隐私和合成数据的应用。
差分隐私守护 AI 进化
以生成Genmoji表情为例,当用户选择共享设备分析数据时,系统会通过随机噪声算法来收集高频指令(如“戴着牛仔帽的恐龙”)。数据收集过程中不会记录频率较低的个性化指令,且所有数据与设备ID完全脱离。
设备端将随机返回真实指令片段或干扰信号,只有当某条指令被数百台设备同时提交时,系统才会识别。这一机制有助于优化多实体组合表情的生成准确率,并且全程不会接触IP地址等敏感信息。
合成数据破解长文本难题
苹果开发了一种独特的合成数据方案,以解决邮件摘要等长文本处理问题。大语言模型首先生成虚拟邮件(例如“明早11:30打网球吗?”),并将其转换为包含主题、语言特征的数字向量(embedding)。参与计划的设备会计算真实邮件的向量并通过差分隐私技术进行匿名反馈。最终,通过多轮迭代,系统能生成反映真实邮件分布的合成数据集,且全程不涉及原始邮件内容。
隐私原则贯穿技术演进
苹果强调,所有Apple Intelligence的模型训练都使用去标识化的数据,并预先过滤掉社交安全号等敏感信息。未来,iOS 18.5等系统将扩展差分隐私和合成数据技术到图像处理、记忆相册等多项功能。
苹果还强调,即使用户启用了设备分析计划,个人数据也始终加密存储在本地,苹果仅获取经过数学验证的群体趋势报告。
"Image" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/a845edbf-b684-48e4-93b2-73566f4cf7f2.jpg)
AI资讯
智谱发布新一代开源 AI 模型 GLM-4-32B-0414 系列,效果比肩 GPT 系列和 DeepSeek-V3 / R1
智谱发布了新一代开源 AI 模型 GLM-4-32B-0414 系列,拥有320亿参数,效果媲美 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列,且支持友好的本地部署特性。该系列包含四款模型:GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414。所有模型均有高质量的预训练数据和强化学习过程,增强了其在指令遵循、工程代码、函数调用等领域的表现。在测试中,GLM-4-32B-0414 的性能比许多更大规模的模型还要优秀,部分指标与 GPT-4o、DeepSeek-V3 等模型相当。
GLM-4-32B-0414 在 IFEval 指令遵循测试中的得分为 87.6,在 TAU-Bench 零售场景测试中的得分为 68.7,在 SimpleQA 搜索增强问答测试中的得分为 88.1。此系列模型还为研究和企业提供了高性能 AI 解决方案,降低了计算成本,支持 MIT 许可。
该系列模型包括:
- GLM-4-32B-Base-0414:在预训练阶段采用15T高质量数据,特别是在推理类合成数据的使用上为后续的强化学习打下基础。
- GLM-Z1-32B-0414:增强了数理能力和解决复杂任务的能力。
- GLM-Z1-Rumination-32B-0414:具有深度思考能力,能解决更复杂的开放性问题。
- GLM-Z1-9B-0414:开源9B小尺寸模型,在数学推理和通用任务中表现出色。
该系列在多个基准测试中表现优异,为 AI 领域提供了一个强大的开源选择。
AI资讯
GPT-4.1深夜登场,中科大校友领队,百万上下文编程惊人,GPT-4.5三个月后淘汰
OpenAI最近发布了三款新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,这些模型在编程能力、指令跟随和长上下文处理上有了显著提升。GPT-4.1系列模型可以处理最多100万Token的超大上下文窗口,进一步提升了GPT-4系列的表现,特别是在代码生成和长文本处理方面。
GPT-4.1 nano是OpenAI的最快、最便宜的模型,具有超高效的性能。相较于前代模型,GPT-4.1在SWE-bench Verified上的得分提升至54.6%,指令跟随能力也大幅增强,尤其是在多轮对话和负面指令的处理上表现突出。
同时,OpenAI宣布,GPT-4.5将在三个月后停用,转而继续优化GPT-4系列。新模型的推行预计将进一步提升开发者的工作效率,尤其是在需要大规模数据处理和快速响应的领域。
定价方面,GPT-4.1比GPT-4o便宜26%,而GPT-4.1 nano的价格更是大幅降低,成为最具性价比的选择。此外,针对重复使用上下文的查询,新模型的提示词缓存折扣提高至75%。
在实际演示中,GPT-4.1展现了强大的编程能力,能够快速生成高质量的代码,且在多种编程任务上超过GPT-4o和GPT-4o mini。它在前端开发、代码库浏览以及任务执行的速度和准确性上也有了显著的提升。
https://img.36krcdn.com/hsossms/20250415/v2_5c303adefcb84510a758e8cd33ff8865@5091053_oswg143335oswg1022oswg898_img_000?x-oss-process=image/format,jpg/interlace,1
随着GPT-4.1的推出,OpenAI的模型将在开发者中获得更广泛的应用,尤其是在需要大规模处理和复杂指令的任务中。
AI资讯
GPT-4.1深夜偷袭,OpenAI掏出史上最小、最快、最便宜三大模型,百万token上下文
OpenAI发布了最新的GPT-4.1系列模型,包含三款新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。相较于之前的GPT-4o和GPT-4o mini,GPT-4.1系列模型在编码、指令遵循和长文本理解方面表现更为优异。
GPT-4.1性能概览:
- 编码能力:GPT-4.1在SWE-bench测试中的得分为54.6%,显著超过GPT-4o和GPT-4.5,表现更为出色。
- 指令遵循:在MultiChallenge基准测试中,GPT-4.1的得分为38.3%,比GPT-4o提高了10.5%。
- 长文本理解:在Video-MME基准测试中,GPT-4.1在无字幕视频理解上的得分为72.0%,超越了GPT-4o。
GPT-4.1 nano:这是GPT-4.1系列中最快、最经济的版本,特别适合对延迟敏感的场景。其在MMLU测试中的得分为80.1%,比GPT-4o mini更为优秀。
应用场景:GPT-4.1的性能优化使其在编码、指令遵循和长文本理解方面为开发者提供了更强的支持。OpenAI表示,GPT-4.1将为智能系统和复杂应用的构建开辟新的可能性。
价格优化:GPT-4.1的成本比GPT-4o低26%,并且在重复查询时,OpenAI提供了高达75%的缓存折扣。
性能测试示例:
- 编码能力:GPT-4.1在代码任务上显著超越了GPT-4o,特别是在多语言差异和编辑大型文件方面更为高效。
- 指令遵循能力:GPT-4.1在多轮自然对话中的表现提升了10.5%。
- 长文本理解:GPT-4.1能够处理百万token级别的上下文,适合用于大规模的代码库和长文档的解析。
总体来说,GPT-4.1系列的发布不仅提升了模型的性能,也在性价比和处理能力上为开发者提供了更大的优势。
AI资讯
“小家电六强”,需要新故事
近年来,小家电行业的市场正在发生深刻变化。随着‘宅经济’的消退,许多小家电逐渐失去市场热度。根据奥维云网的数据显示,2023年厨房小家电整体零售额出现下降,2024年继续下降0.8%。其中,曾经广受欢迎的产品如空气炸锅、电烤箱等西式烘焙类小家电的销量显著下滑,而电磁炉、电饭煲等刚需类产品变化较小。
2020年至2021年,受全球宅经济拉动,小家电市场曾出现一波增长,但随着市场需求的放缓,2022年起,许多小家电品牌的销量开始下滑,只有小熊电器等品牌在直播电商崛起的背景下维持了增长。
此外,随着行业竞争的加剧和价格战的频发,小家电品牌的利润空间被进一步压缩。美的电器的方洪波在股东大会上曾提到,小家电行业的产品更新换代迅速,生命周期短,导致其面临较大挑战。
为了突破瓶颈,小家电行业正在尝试通过‘出海’和‘AI技术’来寻找新的增长点。数据显示,2024年中国小家电行业的出口额同比增长,尤其是海外市场的增长态势较好,尤其是新宝股份和北鼎股份这两家公司,通过海外市场的拓展,取得了较好的业绩。
然而,AI的加入是否能给行业带来实质性的变化仍需观察。虽然一些品牌如小熊电器已经尝试将AI技术应用于产品上,提升用户体验,但现阶段AI更多是为了增强功能,而非带来革命性的使用体验。这种情况下,可能会使得一些价格敏感型用户却步。
总的来说,小家电行业面临的困境并未完全解决,但出海和AI作为未来的可能突破点,仍然值得关注。随着全球市场的逐渐开放,如何找到市场的真正需求并进行精准布局,将是未来小家电企业的关键。
AI资讯
AI 编程新王者:OpenAI GPT-4.1 系列登场
OpenAI 发布了 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,这些模型在编程、指令遵循和长文本理解方面有显著提升。GPT-4.1 在多个基准测试中表现出色,包括编程测试和长文本处理,展示了比前代模型更强的性能。GPT-4.1 系列的特点是提升了代码生成速度,并降低了用户查询成本。
OpenAI 的 GPT-4.1 mini 和 nano 版本则在延迟、成本和性能方面进行了优化,特别适用于低延迟和高效能的开发需求。尽管这些模型在速度和成本上有明显优势,普通用户目前还无法通过 ChatGPT 页面体验这些模型,API 版本目前仅供开发者使用。
模型的开发重点是提升长文本处理能力,并通过优化推理栈和缓存技术,显著降低首次响应时间,为开发者提供了更高效和低成本的解决方案。
这些新的模型还在实际应用中表现优秀,特别是在构建智能代理和复杂任务处理方面,性能提升和成本降低的效果非常明显。
GPT-4.1 系列的 API 定价较 GPT-4o 模型便宜 26%,每 100 万 tokens 输入费用为 2 美元,输出费用为 8 美元。该系列模型特别适用于编程和数据处理任务,可以为开发者提供更高效的解决方案,尤其在处理大规模任务时表现出色。
以下是几个重要特性和优势:
- GPT-4.1 系列全面超越前代模型,支持 100 万 tokens 的上下文窗口。
- GPT-4.1 在编程测试中的得分较 GPT-4o 提升 21.4%,在指令遵循测试中提升 10.5%。
- 小型模型 GPT-4.1 mini 和 nano 提供了更低的延迟和更高的效率,适合低成本任务。
- 新模型能显著提升编程效率和多文档审查的准确率。
在应用领域,GPT-4.1 系列被广泛应用于智能代理构建、编程效率提升等场景,且其低成本的特点使其成为开发者的理想选择。
AI资讯
IT之家采访联发科高管:AI 智能体应用碎片化需树立“灯塔效应”
在2025年4月11日举行的天玑开发者大会上,联发科展示了其在AI智能体应用领域的最新发展,特别强调了AI在移动设备上的应用潜力。通过与全球生态伙伴和开发者的合作,联发科致力于推动AI智能体从碎片化走向统一体验。尤其是从芯片到应用层的整合,联发科提出了‘灯塔效应’的概念,即通过智能体在系统级到应用级的逐步整合,提升用户体验。
关键技术突破
在大会中,联发科展示了其AI芯片天玑9400+的强大性能,强调了强悍的推理能力、超高能效以及端侧训练和隐私安全等特性。通过系统级AI的深度融合,联发科希望能够解决当前智能体在多应用场景下的碎片化问题。
AI智能体场景化
联发科无线通信事业部的高管在采访中提到,AI智能体仍面临着应用场景的局限性,尤其是在更复杂的动态环境中。尽管如此,联发科依然积极推动AI智能体的进步,并致力于开发更加开放、灵活的应用场景。技术的不断进步将使AI智能体能够适应更多复杂场景,从而进一步增强用户的互动体验。
联发科的AI战略
联发科明确表示,其未来的AI智能体将具备‘听、看、感知’等多模态能力,强调通过用户历史数据预测需求。此外,联发科还提出了‘知你懂你’这一AI体验特征,旨在通过细腻的感知与及时的响应来提升用户体验。
游戏领域的应用
在移动游戏方面,联发科强调了其在高帧率和创新体验上的技术突破,特别是在与《王者荣耀》合作方面,通过语音AI实现了沉浸式的游戏体验。未来,联发科还将通过Dimensity Profiler工具优化次旗舰机型的游戏表现。
通过此次采访,联发科明确表示,将继续推动AI智能体在移动设备上的落地,并通过与手机厂商的合作,共同实现AI智能体在更加广泛的场景中的应用。
AI资讯
诺奖得主震撼宣言:AI一年完成10亿年“博士研究时间”
诺贝尔奖得主Demis Hassabis近日表示,DeepMind团队在一年内通过AI完成了相当于10亿年博士研究时间的壮举。DeepMind的AlphaFold-2技术成功预测了2亿个已知蛋白质的三维结构,这一成果将大大推动生物学研究。
在此过程中,AI展示了巨大的潜力,尤其在蛋白质折叠问题上的突破。科学家们过去需要数十年才能完成的任务,如今通过AI被加速至一年内完成,极大地推动了科学研究的进展。
AlphaFold技术不仅为科学家提供了极为重要的数据,而且该技术已成为全球范围内生物学研究的标准工具,至今已被200万研究人员使用,并引用超过三万次。
Demis Hassabis进一步指出,AI的应用不仅限于生物学领域,还将在其他许多领域带来革命性变化,尤其在人类健康和气候变化等重要问题上。DeepMind的目标是利用AI技术解决人类面临的重大挑战。
该技术的成功不仅依赖于深度学习和强化学习的结合,还展示了AI在破解复杂科学问题方面的潜力。DeepMind的AlphaFold技术正是通过这种结合,在蛋白质折叠问题上取得了巨大的突破。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_96c8c7f70f304543b56af02c721dfc60@5888275_oswg281253oswg1080oswg619_img_000.jpg)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_adbb54bbec09404e8a10baafc3a783b2@5888275_oswg64530oswg1043oswg198_img_000.jpg)
"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_7854a34e43d34ddb8e92cd22d9aaf906@5888275_oswg274235oswg1080oswg356_img_000.jpg)
"Image 4" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_bce307c4d3b749d1ad8d9aa6ec5f2b84@5888275_oswg422690oswg1080oswg868_img_000.jpg)
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_2c467eae1f904c5eb4730f141f740967@5888275_oswg706522oswg1080oswg565_img_000.jpg)
"Image 6" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_ae7cc25644de4138af7df1c98177e124@5888275_oswg95544oswg232oswg348_img_000.jpg)
"Image 7" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_cd3eb5ed786e4e2bbfbc979421f7c8ee@5888275_oswg521785oswg1080oswg545_img_000.jpg)
"Image 8" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_13aa484c4cec47c0a51ae1925384c43f@5888275_oswg326113oswg1080oswg532_img_000.jpg)
"Image 9" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_0b94adda57ee463287cca95f37967b9f@5888275_oswg192211oswg1080oswg439_img_000.jpg)
"Image 10" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_83fe01e42ca7477ebc34d22f2e05862e@5888275_oswg927608oswg1080oswg570_img_000.jpg)
"Image 11" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_590b792f255b4ad4b8fdc6f37972b371@5888275_oswg238700oswg1080oswg455_img_000.jpg)
"Image 12" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_1f47f53f773d4d2e841fc9286d37b425@5888275_oswg456224oswg1080oswg608_img_000.jpg)
"Image 13" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_d3189ab421a04294a344c4ed4d9c123d@5888275_oswg422502oswg1080oswg606_img_000.jpg)
"Image 14" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_a5308734f25e49ce98263593e10d1de8@5888275_oswg700326oswg1080oswg591_img_000.jpg)
"Image 15" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_f58e7a821dfc4115bbad0016cab550c1@5888275_oswg281496oswg1080oswg605_img_000.jpg)
"Image 16" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_c8bf5b1d8e4f4236ac66d5f821eb1972@5888275_oswg233666oswg1080oswg606_img_000.jpg)
"Image 17" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_79fc155084644df4b2f920ff36c54728@5888275_oswg349773oswg1080oswg601_img_000.jpg)
"Image 18" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_bf32a3bb2cd64445906d736b4b07bd5c@5888275_oswg694038oswg1080oswg601_img_000.jpg)
AI资讯
刚刚,AI破解50年未解数学难题,南大校友用OpenAI模型完成首个非平凡数学证明
AI辅助人类完成了首个非平凡数学证明,成功破解了50年未解的数学难题!这项突破性的研究由华人学者Weiguo Yin主导,借助OpenAI的最新推理模型o3-mini-high,精确求解了一维J_1-J_2 q态Potts模型中q=3的情况。这项成果不仅为物理学中的悬而未决问题提供了新视角,还展示了AI在科学研究中的巨大潜力。
在这项研究中,作者通过引入最大对称子空间方法,对一维J_1-J_2 q态Potts模型进行了精确求解,特别是针对q=3的情况,使用OpenAI的o3-mini-high模型进行了推导。AI模型不仅成功简化了复杂的转移矩阵,还为许多相关的物理问题提供了新的解决思路。
此项研究的突破性成果,对层状材料中的原子或电子顺序堆叠问题以及非常规超导体中T_c-拱形相的形成等问题具有重要意义。AI技术的应用为众多物理学家提供了新的研究工具,证明了AI在科学研究中不可忽视的作用。
研究者Weiguo Yin,自2004年加入布鲁克海文国家实验室以来,致力于将第一性原理、有效哈密顿量和机器学习方法结合,研究强关联体系、挫败磁性、超导性等领域。此项研究充分展现了AI与物理学结合的巨大潜力,尤其是在解决长时间未解的数学难题方面。
随着研究的深入,AI在物理学中的应用前景将更加广泛,为解决更多复杂问题提供支持。
AI资讯
AI反而是文科生的好时代|对话硅谷AI+创始人Lynn Duan
AIGC的到来让文科生面临新的就业挑战,但也提供了更多机会。Lynn Duan认为,AI的普及并非意味着文科生将完全失去工作机会,相反,能够与AI技术相结合的文科生,尤其是在商业化和市场化领域,将更具竞争力。
AI+的创始人Lynn Duan解释了AI如何取代传统的编程岗位,而将更多重要的商业岗位留给那些具备战略眼光和沟通能力的文科生。Lynn提到,AI将取代大量的技术性岗位,但仍然存在诸如创业、创始人等职位,是无法被AI取代的。
在讨论中,Lynn强调了文科生可以通过AI工具来弥补技术缺口,如通过无代码平台来开发简单的应用程序。她鼓励学生和年轻人去探索初创公司,在那里可以迅速积累经验,并参与到快速变化的工作中,这对于未来的职业发展至关重要。
AI与文科生的未来
文科生如何在AI时代脱颖而出?Lynn认为,创业是未来最有潜力的方向。尤其是,文科生无需精通技术,也能通过理解市场需求和商业化过程,在初创公司中取得成功。
创业与创新
Lynn也谈到了创业者应具备的素质:不仅仅是技术能力,更重要的是要能清晰表达自己的产品理念,并且能够快速应对市场变化。她认为,创业者的认知和经验是AI无法替代的,这使得创业成为一个具有持久吸引力的职业选择。
对应届生的建议
Lynn鼓励应届生关注初创公司,因为在这样的公司中,员工能够接触到更广泛的技能和工作内容,如产品开发、市场营销等,极大丰富个人能力,也能更好地应对未来AI带来的挑战。
AI资讯
推理AI“脑补”成瘾,废话拉满,马里兰华人学霸揭开内幕
研究揭示了推理模型在面临缺失前提(MiP)问题时的表现,尤其是模型如何在这种情况下产生冗长的回答,浪费大量计算资源。推理型语言模型如DeepSeek-R1在MiP场景下,生成的回答长度激增,远远超过非推理模型,且无法有效识别问题缺乏前提。这种过度思考现象暴露了推理型模型在处理病态问题时的缺陷,尽管它们能够生成详细的推理路径,却无法有效识别问题的不合理性,导致大量无效的推理步骤。这种现象进一步揭示了推理型模型缺乏批判性思维,往往无法及时识别缺失的关键信息。\n\n研究中还分析了推理模型在多个数据集上的表现,尤其是在MiP问题上,这些模型显示出回答过长而无法提供准确的解答。相比之下,非推理模型更擅长快速识别问题中的缺失信息并且生成较短的回答,从而避免了不必要的计算负担。\n\n为了更好地理解这种过度思考问题,研究团队设计了多个数据集,通过分析模型的推理步骤,揭示了模型如何在缺失前提的情况下,重复类似的推理路径而没有得到有效的结果。这个现象表明,推理型模型存在自我怀疑的思考模式,无法及时终止推理,导致计算资源浪费。\n\n通过对比不同语言模型在MiP问题上的表现,研究表明,推理模型通常需要更长的回答来应对这些问题,但它们在没有有效前提的情况下,仍然继续推理并产生冗长的回答,而非推理模型则表现得更加高效。\n\n总体而言,当前推理模型在处理缺失前提时存在严重的过度思考问题,暴露了它们的低效性,并且提醒研究人员在构建和优化语言模型时,必须考虑如何避免这种冗长且无效的思考路径。\n\n图1展示了DeepSeek-R1生成的过长回答,这一现象证明了推理模型在处理缺失前提时往往产生不必要的推理步骤。\n"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_6e98b5d9f88d44a5a59e0c95b7547162@5888275_oswg137559oswg1080oswg333_img_000.jpg)\n\n图2展示了不同语言模型在处理MiP问题时的回答长度与放弃率的对比。\n"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_caf6d548a5ff403a9dd2abf68ac2e978@5888275_oswg517439oswg1080oswg678_img_000.jpg)\n\n图3进一步展示了不同模型在MiP问题上的响应和计算步骤的相似性,揭示了推理模型在缺失前提时的冗余性。\n"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_41cfd952c45d43a6ad01160e8251089d@5888275_oswg372787oswg1080oswg660_img_000.jpg)
AI资讯
图灵奖得主 LeCun:人类智能不是通用智能,下一代 AI 可能基于非生成式
Meta 首席 AI 科学家及图灵奖得主 LeCun 在最新播客节目中讨论了 AGI(通用人工智能)与人类智能的区别。他认为人类智能并非通用的,而是非常专业化的,专注于解决与生存相关的问题。他还预测,下一代 AI 可能基于非生成式模型,而不仅仅局限于目前流行的生成式 AI。
LeCun 强调,AGI(或高级机器智能,AMI)将在未来十年内取得重要进展,但并不会像许多人预期的那样快速实现。他解释道,虽然 AI 已经在特定领域超过了人类(如围棋、图像识别),但要实现像生物一样适应现实世界的智能体仍面临巨大挑战。
在节目中,他还提到智能眼镜是 AI 技术落地的重要方向,未来的 AI 助手将具备全天候陪伴、多感官交互以及专业化分工等特点。
在谈到开源问题时,LeCun 表示 Meta 的开源策略帮助推动了 AI 生态系统的发展。他认为,开源对于 AI 技术进步至关重要,不仅能带来创新,还能避免技术垄断。
节目中的讨论还包括人工智能下一步的研究方向,LeCun 提到未来的 AI 需要具备理解物理世界、推理和规划能力、持久记忆以及安全可控等关键能力。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/10b5511f-04b4-487c-bfd7-5a379e4f3195.png)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/cb035a72-41c0-4849-be4c-256b89276664.png)
"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/7409e455-a967-46b4-88d9-6692bc99bb23.png)
"Image 4" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/c9e87e27-08b1-46aa-9fcf-825973bfcb63.png)
AI资讯
Super App来了!看AI应用正如何「改写」商业世界?|2025 AI Partner大会核心看点
随着全球AI竞赛步入中国时刻,一场深刻的技术变革正在悄然改变产业格局。2025年春季,中国AI应用突破不断,多个突破性进展正在引领行业走向AI应用的黄金时代。DeepSeek、Manus、Kimi等AI技术相继发布,彰显了中国在AI技术领域的领先地位,预示着AI应用的全面崛起。
在这一关键时期,AI技术跨越技术壁垒,向规模化应用迈进,如何在这种环境下创新,成为当下的重要命题。2025 AI Partner大会将在上海盛大举办,以“Super APP来了”为主题,重点探讨AI超级应用如何重塑商业逻辑和产业格局,探索AI带来的无限可能。
大会分为“Super App来了”和“谁是下一个超级应用”两大篇章,内容涵盖AI技术的创新与应用,AI应用如何渗透到智能制造、金融科技、医疗健康等领域。大会邀请了国内外多位AI领域的领军人物,将针对AI应用的现状与未来趋势进行深度剖析。
本次大会将发布“2025 AI原生应用创新案例”及“2025 AI Partner创新大奖”,通过展示那些能真正推动行业创新的AI应用案例,帮助企业了解和借鉴AI技术应用的成功经验。通过这些行业案例,参与者可以深入了解AI如何在实际场景中创造价值,推动企业在AI浪潮中获得竞争优势。
此外,36氪还联合GMI Cloud与TiDB举办了闭门研讨会,聚焦全球AI应用的挑战与机遇,为中国AI企业提供全球化发展路径的深入剖析。在这一过程中,AI技术的商业化将会推动产业变革,带来前所未有的市场机遇。
"image" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_d1f08180d85749acb1131fe62b2fcb2f@5868219_oswg69826oswg1080oswg460_img_000.jpg)
"image" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_e84854667cfb4f7b9e9a5de740627251@5868219_oswg74691oswg1080oswg608_img_000.jpg)
"image" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_d536eccdf04e47f5a35888780d294ac0@5868219_oswg1054395oswg1080oswg9025_img_000.jpg)
AI资讯
GitHub中国IP访问崩了又复活,OpenAI API新政恐锁死GPT-5?
GitHub中国区突然访问受限,官方回应称是由于配置失误,现已恢复。与此同时,OpenAI推出API新政,要求开发者通过‘已验证组织’流程才能访问前沿模型。此政策的引入旨在加强API的安全性,并通过身份证件验证来认证组织,防止不安全的使用。新政可能会对全球AI生态系统产生广泛影响。
GitHub访问受限
昨日,GitHub在中国区出现访问问题,许多开发者无法登录。官方解释称这是由于一次不当的配置更改,影响持续时间为2025年4月12日至13日。问题已得到解决,开发者现在可以正常访问GitHub。
OpenAI API新政
OpenAI推出了API‘已验证组织’的新政,要求开发者通过验证身份来获取访问高级模型的权限。为了成为已验证组织,开发者必须提供政府签发的有效身份证件,并且每个身份证件在90天内只能验证一个组织。此举旨在减少AI的不安全使用,并确保只有符合条件的组织才能使用前沿模型。
新政的影响
此验证流程虽然简单,但可能会限制部分开发者的使用权限。OpenAI表示,验证流程旨在提升安全性,防止滥用其技术,尤其是对于全球范围内可能存在的违规行为。对于未通过验证的开发者,当前仍可使用现有模型,但某些高级功能则需要通过验证才能解锁。
支持国家/地区
OpenAI支持来自超过200个国家/地区的身份证明文件,开发者可通过验证流程确认自己的国家/地区是否符合条件。
"Image 8" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_f607bb7b45834656b82052c207933c6b@5091053_oswg114205oswg945oswg341_img_000.jpg)
"Image 9" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_eb7d912cb1ff4d99bb933690d5fbcd3c@5091053_oswg229133oswg1080oswg702_img_000.jpg)
"Image 10" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_e3a3327e69c943479c20fb8119f4a785@5091053_oswg27380oswg1080oswg262_img_000.jpg)
"Image 11" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_34c309c0806a48be93426cbcc933852b@5091053_oswg99723oswg1080oswg736_img_000.jpg)
"Image 12" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_bb6b277cd56b44528f8f968d393c56ae@5091053_oswg143442oswg874oswg1178_img_000.jpg)
"Image 13" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_5a69b4bde7764390ad2d8e79c68bb65e@5091053_oswg152857oswg1080oswg584_img_000.jpg)
"Image 14" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_678e61fc6f394203a7bc8be7391019a5@5091053_oswg154585oswg1080oswg748_img_000.jpg)
AI资讯
AI,让游戏再次伟大
在当前AI技术广泛应用的时代,越来越多的游戏开发商开始探索将AI融入游戏角色中,使其更加栩栩如生。近期,索尼通过AI驱动的《地平线:西之绝境》主角Aloy引起了广泛关注,但随之而来的却是恐怖谷效应的挑战。尽管AI能够让Aloy与玩家进行语音互动,并表现出相应的面部表情,然而许多玩家却反馈称,Aloy的表情显得过于僵硬,令人感到不自然,无法真正融入对话。与此不同的是,米哈游创始人蔡浩宇的AI公司Anuttacon推出的手游《Whispers from the Star》中的女主角Stella,虽然外形受到好评,但“纯聊式”的玩法对社交恐惧症玩家可能造成困扰。
在游戏历史上,NPC(非玩家角色)的智能水平经历了从“人工智障”到智能化的演变。在早期的《超级马里奥》游戏中,NPC仅是无情、无脑、无存在感的“背景道具”,而随着时间的推移,游戏AI逐渐复杂化,开始涉及到有限状态机与行为树等概念。在《吃豆人》这款经典游戏中,AI通过为幽灵设计独特的行为模式,使得游戏更加有趣和富有挑战性。
随着游戏的复杂性提升,行为树等AI技术的引入使NPC的行为更加多样化,但也暴露出了AI算法的局限性。例如,行为树虽然较为复杂,但其基本局限在于所有行为都事先设计好,无法应对一些意外情况。随后,AI技术通过结合蒙特卡洛树搜索和深度神经网络等先进算法,使游戏中的AI变得更加智能,能够在与人类玩家对战时展现出强大的实力。
最终,随着技术的不断进步,游戏中的AI逐渐从单纯的行为驱动演变成具备“学习”能力的存在,从而让玩家在与AI对战时体验到更加复杂和有趣的互动。
AI资讯
人工智能主权困局:国家安全叙事如何吞噬AI的公共价值?
人工智能主权困局:国家安全叙事如何吞噬AI的公共价值?
全球各国竞相争夺人工智能主权,将主权控制置于人类福祉之上。在为时已晚之前,我们需要一条新的道路。所谓的“人工智能主权”,就是对关键的人工智能投入实现完全的国内控制。中国、美国、印度、日本和加拿大等国家的政策讨论都在朝着这个方向加速推进。
这是一个令人担忧的趋势。广泛追求强有力的人工智能主权是两败俱伤之举:一方面增加了全面人工智能军备竞赛的可能性,各国将发展策略重点放在国家安全利益上;另一方面又挤占了旨在服务于更广泛公共利益的人工智能工具的发展空间。
解析人工智能主权
人工智能主权(AI Sovereignty),是指国家对国内“人工智能堆栈”的控制,即控制用于训练模型的数据、支撑模型运行的计算资源、完善模型所需的人才以及推广模型所需的能源。
在此定义基础上,“强人工智能主权”要求所有要素完全本土化,而“弱人工智能主权”则允许通过可信赖的盟友实现部分控制。
在人工智能发展的萌芽阶段,多数国家接受弱人工智能主权作为合理选择——例如依赖英伟达芯片或中国开源模型。但拜登政府末期,美国开始从"可靠技术栈提供者"的角色中抽离。其算力扩散政策将世界划分为三个等级:第一梯队(含英国、法国、德国等18国)可无限制获取美国芯片;第二梯队(全球多数国家)面临芯片数量上限;第三梯队(25个受武器禁运的敌对国家)则被全面禁止进口美国芯片。
而特朗普政府似乎准备全力迈向强人工智能主权,推行"美国优先"的人工智能战略。副总统万斯在"美国活力峰会"上批评前任政府"将工业基础拱手让与他国",呼吁在本土完成人工智能的制造、设计和扩散。OpenAI在提交给科技政策办公室的文件中敦促政府提升本土芯片产能,警告中国已在该领域占据战略优势。Anthropic公司则主张强化出口管制,将更多芯片纳入禁运范围。美国新安全中心和商业圆桌会议等机构强调,美国必须建立自主的人工智能基础设施。
这些迹象表明,美国正从弱人工智能主权转向强人工智能主权模式,而其他国家很可能会马上竞相效仿。
强人工智能主权的扩散
强人工智能主权的典型表现是,国家支持的人工智能项目激增,而这些项目通常将国家利益置于国际合作之上。中国则通过直接注资和优先算力支持,推动深度求索(DeepSeek)等本土企业突破技术瓶颈。欧盟和法国对米斯特拉尔人工智能公司(Mistral AI)的支持体现了这一趋势,该公司已成为法国对抗美国人工智能主导地位的回应。
人工智能与军事系统和关键基础设施的整合,进一步加速了实现强大人工智能主权的动力。实际上,美国的盟友已经开始担忧美国系统在联合防御中的可靠性,并产生了实质影响:加拿大等国开始质疑是否继续采购需在美国维护的F-35战机。这种对依赖美国军事技术的日益警惕代表着与前几十年相比的明显转变。
技术壁垒即语言限制,同样影响主权化进程。非英语国家面临语言数据集劣势,阿拉伯语、泰语等语言的AI系统表现显著落后,迫使这些国家创建本土语言数据集。从长远来看,对更多数据的控制可能会维持这种对强人工智能主权的初步追求。
数据价值的指数级增长也重塑了主权定义。金融交易、医疗记录等数据不再是简单的隐私问题,而是训练预测模型的战略资源。数据价值通过推理能力呈指数级增长——一个控制着海量金融交易、医疗记录或电信元数据的国家,就具备能够开发出超级人工智能的基础。这意味着控制存储和处理位置的数据主权框架正在迅速扩展,涵盖整个人工智能价值链——从原始数据收集到模型训练再到推理部署。
大规模人工智能部署带来的巨大能源需求是另一个关键的主权因素。许多国家发现,依赖外国能源基础设施来训练前沿模型会带来不可接受的漏洞。因此,从韩国到沙特阿拉伯,各国正在斥巨资建设专门用于处理人工智能工作负载的发电设施。因此,韩国、沙特等国正斥巨资建设专用能源设施,而法国、意大利等能源匮乏国不得不与资源富集国合作。这种能源依赖从根本上破坏了人们对强大人工智能主权的渴望,迫使人们做出务实的妥协,在国家控制力和运营可行性之间取得平衡。
人才短缺是另一大障碍。现实情况是,全球人工智能人才分布高度集中。传统技术中心以外的国家,尤其是发展中地区,在组建能够构建具有竞争力的基础模型或在政府和军事环境中实施复杂人工智能应用的团队方面面临严重限制。对于这些国家而言,允许外国专家协助人工智能开发不仅仅是一种偏好,而是一种必要,即使这可能带来潜在的漏洞。
然而,各国在关键人工智能投入方面对外部来源的依赖不太可能长期持续下去。任何对其他国家的依赖——无论是人才、能源还是其他关键人工智能投入——都代表着一种战略弱点,随着人工智能在国家实力中地位的不断上升,这种弱点将越来越难以被各国政府所容忍。
**最终的风险在于,人工智能的安全化会成为一个自我实现的预言。**随着越来越多的国家采取防御性的人工智能主权姿态,国际合作逐渐减少,最终导致各国最初担忧的、竞争性且可能充满对抗性的国际人工智能格局。这种动态可能会将原本可能是人类最有力的集体解决问题工具,转变为一种主要为民族国家之间的竞争而优化的技术。
AI资讯
HBM与先进封装:AI算力革命的隐形赛点
人工智能大模型的爆发式发展正在重新定义全球半导体产业格局,特别是在高带宽存储器(HBM)和先进封装技术的推动下,AI算力需求呈指数级增长。随着技术的进步,HBM已发展到第四代,并通过3D堆叠和硅通孔技术大幅提升存储带宽,显著降低数据搬运时间。此外,先进封装技术的应用,通过异构集成和系统级整合,大大提高了芯片的集成度与效率。
HBM:突破存储墙的“垂直革命”
传统计算架构中的内存墙问题,导致数据传输的延迟和能效低下,限制了算力提升。HBM技术通过3D堆叠和硅通孔技术突破了这一瓶颈,显著提升了内存带宽和容量。最新的HBM3E技术使得数据传输速率达到了1TB/s,极大地提高了AI处理效率,尤其是在大型AI模型推理中,HBM技术成为必不可少的关键。
先进封装:从“单一芯片”到“系统级整合”
随着摩尔定律放缓,传统芯片的性能提升遇到了瓶颈。先进封装技术的出现,通过提高集成度和优化芯片间连接,成为提升AI算力的重要手段。通过2.5D和3D封装技术,芯片的性能得到了极大增强,使得内存与处理单元的协同效应更加显著。
HBM与先进封装的深层协同
HBM与先进封装技术的结合推动了AI算力的整体提升,缩短了数据传输路径,提升了AI训练和推理的速度和准确性。这一技术组合不仅推动了AI技术的革新,也改变了整个半导体产业的格局。
AI资讯
字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开,4 月 17 日开放接口
字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开,4月17日开放接口。该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,具有显著的推理成本优势,相比于 DeepSeek R1 推理成本降低了50%。
模型性能表现:
- **专业领域:**数学推理(AIME 2024 得分 86.7,追平 OpenAI o3-mini-high),编程竞赛(Codeforces pass@8 达 55.0%,接近 Gemini 2.5 Pro),科学推理(GPQA 得分 77.3%,接近 o3-mini-high)。
- **通用任务:**在人类评估中,Seed-Thinking-v1.5 的表现超越 DeepSeek R1 8%。
- **成本优势:**推理成本相比 DeepSeek R1 降低 50%,实现性能与效率的平衡。
数据体系:融合可验证与创意性数据
针对推理与生成任务的不同需求,优化了数据处理策略:
- **可验证数据:**通过百万级数据三重清洗,保留了10万道高难度题目,确保模型输出真实推理过程。
- **非可验证数据:**基于豆包1.5 Pro训练集,优化生成质量,剔除低价值样本,采用两两对比奖励法。
奖励模型:双轨体系校准训练方向
提出双轨奖励机制,兼顾“对错分明”与“见仁见智”任务:
- **可验证任务:**从字符匹配升级为推理步骤逐行对比,确保模型“奖励欺骗”问题解决。
- **非可验证任务:**引入pairwise对比训练,通过千万次“AB测试”,捕捉人类对创意、情感等的隐性偏好。
训练方法:监督精调 + 强化学习双阶段优化
Seed-Thinking-v1.5采用全链路训练:
- **监督精调:**基于40万高质量实例,确保模型“像人类一样思考”。
- **强化学习:**通过三重数据引擎,解决训练不稳定、长链推理断层等问题。
训练框架:支撑 20B MoE 的底层架构
为应对20B MoE的复杂训练需求,优化了底层架构:
- **HybridFlow 编程模型:**支持算法快速探索与分布式并行运行。
- **流式推理系统:**提高训练速度并提升稳定性。
- **三层并行架构:**基于张量、专家和序列并行,优化GPU算力利用率。
AI资讯
AI 席卷校园:百万条对话揭秘“Claude 是代码救星还是作弊工具”
从编程到论文,AI 无处不在!一项针对百万条学生对话的分析显示,AI 不仅能调试代码,还能润色文章,甚至生成学习资料,但也引发了关于学术诚信的讨论。
AI 已成为大学生日常学习的得力助手,尤其在计算机专业和理工科领域,AI 工具的使用尤为广泛。大规模的研究表明,学生与 AI 的交互模式多样,包括直接解决问题、直接生成内容、协作解决问题和协作生成内容等四种主要模式。
研究发现,学生使用 AI 的目的多为创造新知识和分析问题,如编程项目的创建和法律概念的分析,符合高阶认知功能的需求。但也有担忧,学生可能会过度依赖 AI,影响自身认知能力的锻炼。
教育领域的 AI 使用情况
AI 的使用模式不仅仅限于编程和技术解答,还涉及学术写作、数据可视化等任务,研究发现 AI 的使用主要分为四种模式,每种模式在数据中的占比相似,体现了学生与 AI 互动的多样性。
学科间 AI 使用差异
AI 在不同学科中的使用模式差异显著,计算机专业的学生使用频率最高,而商科、健康科学和人文学科的学生使用较少。尤其是计算机专业的学生,他们主要通过 AI 来完成编程任务,显示了 AI 在处理 STEM 任务中的优势。
学术诚信与 AI 互动的挑战
尽管 AI 在学术领域的应用非常广泛,但如何避免学生利用 AI 作弊仍是一个棘手问题。研究指出,AI 帮助学生直接生成内容或解决问题,可能会在一定程度上侵犯学术诚信,特别是在考试或作业中利用 AI 来获取答案。
AI 对学生认知任务的影响
研究还分析了学生交给 AI 完成的认知任务。结果显示,AI 主要用于高阶认知任务,如创造和分析,而低阶认知任务的占比相对较低。虽然 AI 的这些能力显著提升了学生的学习效率,但也引发了对学生依赖 AI 的担忧,认为这可能会阻碍其自主思考和批判性思维的培养。
AI资讯
盘点AI 时代的六大关键词
在科技浪潮奔涌不息的当下,企业的数字化转型已经不再是选择题,而是决定生死存亡的必答题。AI作为核心驱动力,正全面影响着企业的运营、创新与发展。本文从企业数字化的角度,总结了六大关键词,它们就像六把钥匙,揭示了AI时代企业转型的关键密码。
第一,认知与共生
企业管理者对AI的认知差异明显。少数领先企业已经把AI作为战略核心,但大多数企业仍缺乏实际应用方案。AI时代,企业领导的认知非常关键,认知的误差可能导致AI技术的错用,或者错失机会。企业要推动“人机共生”,通过数据反馈和AI协同,形成动态的智能生态系统。
第二,变革与重构
AI不仅是工具的升级,而是对企业运作模式的彻底改变。企业需要变革传统的工作方式,重构组织架构和业务流程,变成一个能自主学习的智能体。思维转变是最难的,员工和管理者必须学会与AI共生,推动企业自我进化。
第三,数据驱动
AI的核心依赖于数据。数据的质量直接影响AI的效果,优质数据应具备“干净”、“完整”与“新鲜”三大特质。企业要建立健全的数据管理机制,确保数据的高质量流通与应用。
第四,场景与价值
AI的应用应聚焦实际痛点,找到合适的切入点。好的AI应用是解决实际问题,而非仅仅追求技术的高级。AI的价值体现在能够省钱、提高效率,并创造新的机会。
第五,容错与信心
企业在引入AI时必须保持容错心态,通过小范围试点和快速迭代,逐步建立信心。AI的成熟需要时间,企业的信心源自于每一次小小的进步。
第六,进化与边缘化
AI时代的企业必须持续进化,不能满足现状。随着技术的不断更新,企业需要主动升级,避免被边缘化。企业的信息部门也需要转型,从传统的IT支持角色转变为智能架构师,推动数字化进程。
总结来说,AI时代的数字化转型是一个全方位的变革,企业需要从认知、技术、数据和应用场景等方面进行全面优化。成功的数字化转型不仅仅依赖技术,更需要全员的认知提升和持续的适应能力。
AI资讯
国产AI六小虎已经有俩变小猫,他们活下去的理由不好找
4月10日,国产AI六小虎之一的百川智能迎来了两周年庆典,CEO王小川在全员信中宣布将减少多余动作,专注于医学方向。与此同时,零一万物也调整战略,宣布全面转向‘小而美’,将重点放在To B市场的‘企业大模型一站式平台’上。过去的雄心壮志,逐渐转为现实的市场竞争。在竞争激烈的AI市场,六小虎们面对巨大的挑战,纷纷在技术、市场方向和定位上做出调整。
百川智能决定专注于医疗AI,放弃大模型的训练,押注行业应用。尽管市场环境变动,王小川对医疗AI充满信心,认为该领域仍有突破空间。医疗AI的挑战在于数据获取和合规问题,但随着医疗行业的快速发展,AI的应用前景广阔。
零一万物则试图通过结合DeepSeek平台,推动大模型在To B市场的应用,但业内普遍对其前景持谨慎态度。王文广指出,‘一站式平台’虽然有市场空间,但价格战和市场竞争将导致其商业化进程变得艰难。企业需要找到独特的技术优势,才能在To B市场中脱颖而出。
在国内的AI领域,‘开源’模式逐渐成为市场的重要趋势,DeepSeek开源后,对于行业的加速应用起到了积极推动作用。金融行业尤为受益,逐步将AI技术应用到运维和日常办公等领域。尽管AI技术面临幻觉率高的问题,但随着技术的优化和进步,企业将能更好地利用AI技术提升效率。
尽管面临许多挑战,六小虎们仍在努力寻找活下去的理由,从AI领域的角度看,医疗AI、To B市场、开源应用以及技术创新将成为未来竞争的关键。
AI资讯
AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?
AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?
从编程到论文,AI在学生的日常学习中扮演着越来越重要的角色。一项针对百万条学生对话的分析显示,AI不仅能调试代码,还能润色文章,甚至生成学习资料。然而,这也引发了关于学术诚信的严肃讨论。本文将详细探讨AI在教育中的应用,特别是在高等教育中的实际使用情况。
研究背景与方法
为了了解AI在教育中的实际应用,Anthropic公司对Claude.ai平台上100万条匿名学生对话记录进行了分析。研究聚焦于学生在学业中如何使用AI工具,以及这些工具对学术成果的潜在影响。
主要发现
1. AI工具的使用情况
- 理工科学生,尤其是计算机专业学生,使用Claude的比例远高于其他学科。尽管计算机专业仅占美国学位的5.4%,但在Claude.ai的对话中,占比却高达36.8%。
2. 四种使用模式
- 研究总结了学生与AI交互的四种模式:直接解决问题、直接生成内容、协作解决问题和协作生成内容。每种模式的占比相似,约为23%-29%之间。
3. AI的用途
- 学生主要使用AI来创造新知识和进行分析,尤其是在编程项目和法律概念分析等高阶认知任务上。值得注意的是,AI可能会影响学生的认知能力锻炼。
学科使用AI的情况
根据研究,计算机科学、自然科学和数学专业的学生,普遍早期接触并使用AI。特别是在编程相关任务中,Claude表现出色。
学生如何与AI互动
学生与AI的互动呈现出四种模式,其中最常见的是‘直接对话’,即学生寻求快速的答案或解决方案。其次是‘协作对话’,学生与AI共同完成任务,提升学习效果。
结论
AI的使用不仅提升了学生的学习效率,但也带来了新的学术诚信挑战。如何平衡AI的辅助作用与学生自我认知能力的培养,成为教育领域亟待解决的问题。
AI资讯
为什么说广告是AI大模型公司最现实的商业化选择?
从ChatGPT开启订阅模式开始,业界普遍认为大模型公司的商业化道路就是订阅制,但这其实是一个误区。广告依然是AI大模型公司最现实的商业化选项。
1. 行业内的广告实践
谷歌自2023年起在其对话型AI产品中加入了广告,特别是在搜索结果概要部分。Perplexity于2024年引入广告,形式包括“答案后的相关问题”和“侧边栏广告”,这些都标注为“赞助”。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_743c5e558b744f2cafa2980071cb44c1@000000_oswg59318oswg1080oswg510_img_000.jpg)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_789280edc89b421abbe1fa1707120d00@000000_oswg62882oswg1080oswg729_img_000.jpg)
微软的Bing搜索早已在AI助手中集成了广告,而OpenAI也在考虑是否将广告引入ChatGPT。
2. 不做搜索的公司也在尝试广告
尽管OpenAI和其他非搜索公司也在考虑广告,但由于产品竞争的市场因素,它们并未急于引入广告。腾讯也在讨论AI的广告变现模式,认为效果广告可能会成为更快的商业化手段。
3. 广告的效能
AI大模型天然地能够捕捉和响应用户的“意图”,使其成为理想的广告平台。通过精准的需求匹配,广告效率大大提高。与传统广告相比,大模型通过精确的意图表达,能提升广告的投放效果。
4. 大模型产品的意图表达优势
大模型产品通过深度理解用户意图,使得广告投放更加精准。相比搜索引擎的关键词匹配,大模型能够识别用户的细致需求,从而提升广告效能。
5. 为什么不是所有公司都在加广告
许多公司尚未将广告集成到产品中,原因在于产品竞争激烈,且尚未在产品早期形成共识。但随着广告模式的成熟和技术的进步,未来会有更多大模型公司选择广告作为商业化手段。
6. 商业伦理与广告
有些公司担心广告可能会影响产品的客观性和用户体验,特别是在AI产品中,如何平衡广告与公正性是一大挑战。但只要技术足够强大,能够不伤害用户利益,广告模式是可以接受的。
7. 结语
广告与AI大模型的商业化高度契合,未来广告很可能会成为更多大模型公司的选择,尽管目前部分公司尚未全面实施广告模式。
AI资讯
人类一生所学不过 4GB,加州理工顶刊新研究引热议
研究概述
科学家们提出了一个令人惊讶的结论:人类大脑的学习积累上限为4GB,相比之下,它远低于现代计算机的储存能力。根据最新的研究,人类的信息处理速度仅为每秒10比特,而我们的感官系统每秒却能收集10亿比特的数据。这一发现揭示了人类思维速度的极限,并提出了人类如何逐步被机器所超越的可能性。
研究结论
这项研究显示,即便人类全天候不间断学习,100年内的知识储存也不过4GB。与此相比,当前的语言模型通过参数存储信息,70亿参数的模型可以存储140亿比特的知识。
人类与机器的对比
研究进一步提出,随着算力的提升,机器在各类任务中的表现逐渐超越人类。例如,马斯克的脑机接口技术面临着信息传输速率的限制,因为人脑的计算速度仅为每秒10比特,这与电话传输的速率相匹配,且无法突破。
神经系统的处理瓶颈
作者指出,尽管大脑的神经元具有处理信息的能力,但由于信息处理采用串行方式,限制了大脑在高速度信息处理中的表现。进化过程中,这一串行处理方式固化了人类的认知架构,使得我们无法像计算机一样并行处理任务。
对脑机接口的看法
尽管当前脑机接口技术尝试突破这一瓶颈,但由于人类大脑的基本结构所限,提升信息处理速度仍存在极大的挑战。研究者指出,尽管脑机接口能够提供帮助,但它无法突破根本的神经限制。
结语
这一研究引发了学术界的广泛讨论,并对人类如何与机器相互作用、如何提高学习和认知能力提出了重要的思考。研究者们认为,虽然10比特/秒的速率已经满足人类生存需求,但随着技术的发展,未来机器可能会逐渐取代人类在某些任务中的作用。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/35e695d7-2f25-4ff0-82a8-65cf81742c88.png)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/803a85e7-5be0-4368-9972-43876c90c8ed.png)
"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/172c7e88-a130-45fd-ade7-2e468ed6b274.png)
"Image 4" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/0497a8b6-3a9f-4b30-8da6-27dd871b29a7.png)
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/324579aa-8498-4e3e-a5c7-5dae14725212.png)
"Image 6" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/c8a63367-89d9-4fe2-a1be-a4194c4f3149.png)
"Image 7" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/85a8f91d-b23e-4de7-8353-80764e5da1d3.png)
"Image 8" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/862f5382-9cab-4132-98f1-f8a0b41bda5f.png)
"Image 9" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/8d9fa870-e498-4cec-850d-f04601baa157.png)
"Image 10" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/a78d73ba-beb5-4159-a6e9-e73d54a2e19c.png)
"Image 11" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/990e8765-78b0-4b82-b603-9c2a616df58b.png)
"Image 12" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/386c95e2-1ef1-4152-b506-0b1d5e87fc30.png)
"Image 13" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/3c049fc0-b22b-4bf9-9bb3-bd159cbccc9f.png)
"Image 14" (https://img.ithome.com/newsuploadfiles/2025/4/3c049fc0-b22b-4bf9-9bb3-bd159cbccc9f.png?x-bce-process=image/quality,q_75/format,f_webp)
AI资讯
微软研究:AI 编程助手软件调试能力堪忧
微软研究:AI 编程助手软件调试能力堪忧
在一项微软研究院的最新研究中,研究人员发现多款人工智能编程助手模型在调试软件方面的表现不尽如人意,包括Claude 3.7 Sonnet 和 OpenAI 的 o3-mini等,这些模型在软件调试任务中成功率最低未超过50%。
研究背景
OpenAI、Anthropic等顶尖人工智能实验室开发的AI模型被越来越多地应用于编程领域。据微软研究院的数据,这些AI模型在软件漏洞调试任务中的成功率十分低,未能成功解决大多数问题。研究表明,尽管这些AI模型在生成代码方面表现优异,但它们在使用调试工具和解决问题的过程中仍然存在明显的不足。
调试任务的挑战
研究人员使用了九种不同的模型,测试了它们在SWE-bench Lite软件开发基准测试中的表现。这些模型的成功率相差甚远,其中Claude 3.7 Sonnet的成功率最高,为48.4%。而OpenAI的o3-mini则以22.1%的成功率排名最低。
主要问题:数据不足
微软研究人员指出,AI模型调试失败的主要原因是训练数据的匮乏,特别是缺乏充分的“顺序决策过程”数据,即人类调试过程的数据。这类数据对于训练AI模型以完成高效的调试任务至关重要。研究人员认为,尽管当前AI模型的表现欠佳,但通过专门的数据训练,模型有潜力成为更强大的调试工具。
总结
这项研究为AI编程助手在调试领域的应用提供了深入分析。尽管这些技术尚未达到完美水平,但它们在未来仍有很大的发展潜力。随着数据的不断积累和技术的进步,AI可能会逐步完善并在更多编程任务中发挥更大作用。
"AI调试" (https://img.ithome.com/newsuploadfiles/2025/4/85e8197e-b283-4bb5-9fde-735cbb59f545.jpg?x-bce-process=image/quality,q_75/format,f_webp)
AI资讯
永别了,GPT-4
GPT-4的退役与AI的快速进化
OpenAI宣布,GPT-4将在2025年4月30日起被其继任者GPT-4o完全取代。虽然GPT-4将从ChatGPT中移除,但用户依旧可以通过OpenAI API继续使用它。
在此之前,各种爆料纷纷出现在AI圈内,未来的模型如GPT-4.1、o3 mini等预计将于不久后发布。
GPT-4的成就
2023年3月14日,GPT-4发布,引起全球范围的广泛关注。它是一种多模态的大型人工智能模型,具备图像与文本同时理解的能力,并在多个学术考试中取得出色成绩,甚至击败许多顶级学者。
随着GPT-4的退役,OpenAI的技术进化加速,GPT-4o成为当前的默认模型,在编程、写作等领域的表现超过了GPT-4。
GPT-4的历史地位
GPT-4不仅在各类考试中表现突出,且凭借其多模态能力,引领了人工智能技术的革命。它的发布和普及,推动了全球AI产业的迅猛发展。
GPT-4的退役标志着人工智能领域的又一个重要发展节点。随着新的模型即将到来,AI的进步已突破了一个临界点,未来的技术发展更具挑战性与可能性。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_23a9aea16f004f7183acc0596bb6cf19@6100851_oswg269961oswg1080oswg460_img_000.jpg)
未来展望
AI技术的演变非常快速,未来几个月内,可能会有更多新技术诞生。GPT-4.1等新一代AI模型的推出,将为全球AI产业带来更大的变革与突破。
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_13be744a4d81483fb0855423be4403ac@6100851_oswg174414oswg1080oswg1228_img_000.jpg)
这场技术的竞赛正在加速,而AI的未来充满了无限的可能性。
AI资讯
英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型,推动 AI 高效部署
英伟达发布了名为 Llama-3.1-Nemotron-Ultra-253B-v1 的新模型,这是一款具有 2530 亿参数的大型语言模型,专注于推理能力、架构效率和生产准备度的重大突破。
"Image 6" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/506aa3d3-ad5a-4408-8835-43281c854469.jpg)
随着 AI 在数字基础设施中的普及,企业和开发者需要在计算成本、性能与扩展性之间找到平衡。大型语言模型(LLM)的快速发展提升了自然语言理解和对话能力,但其庞大规模常导致效率低下,限制大规模部署。
Llama-3.1-Nemotron-Ultra-253B-v1(简称 Nemotron Ultra)针对这一挑战,基于 Meta 的 Llama-3.1-405B-Instruct 架构,专为商业和企业需求设计,支持从工具使用到多轮复杂指令执行等任务。
Nemotron Ultra 采用仅解码器的密集 Transformer 结构,通过神经架构搜索(NAS)算法优化,创新之处在于采用跳跃注意力机制,在部分层中省略注意力模块或替换为简单线性层。此外,前馈网络(FFN)融合技术将多层 FFN 合并为更宽但更少的层,大幅缩短推理时间,同时保持性能。模型支持 128K token 的上下文窗口,适合高级 RAG 系统和多文档分析。
在部署效率上,Nemotron Ultra 也实现了突破,能够在单 8xH100 节点上运行推理,显著降低数据中心成本,提升企业开发者的可及性。英伟达通过多阶段后训练进一步优化模型,包括在代码生成、数学、对话和工具调用等任务上的监督微调,以及使用群体相对策略优化(GRPO)算法进行强化学习(RL)。这些步骤确保模型在基合。
AI资讯
移动端 AI 安全再突破:水印保护新范式 THEMIS 框架发布
随着智能手机和物联网设备的普及,移动端 AI 成为趋势,提供了离线运行、低延迟、隐私保护等优势。然而,模型的本地存储同时带来了严重的安全风险。具体来说,模型提取与盗窃成为主要问题,攻击者通过逆向工程提取模型,窃取开发者的核心资产。除此之外,知识产权的侵犯也成为一大隐患,被盗模型可能会被非法重用、再分发、甚至商业化,带来经济损失。
为了保护这些模型,来自墨尔本大学、西澳大学、香港城市大学和慕尼黑工业大学的研究者提出了水印保护的新范式 —— THEMIS 框架。这是首个针对移动端 AI 模型部署后保护的系统性解决方案,并且该研究已经被全球顶级安全会议 USENIX Security 2025 接收。
THEMIS 框架的核心是一种自动工具,通过重构可写对应模型,解除设备上深度学习(DL)模型的只读限制,利用设备上模型的不可训练性解决水印参数问题,从而保护模型所有者的知识产权。
经过广泛的实验验证,THEMIS 框架显示出了显著优势,在 Google Play 上的 403 个现实世界的 DL 应用程序中,水印保护成功率高达 81.14%。
该框架的应用展示了其在多个领域的广泛适用性,包括医疗、金融、智能家居等多个场景。同时,THEMIS 具有强大的攻击防御能力,即使在模型提取和转换攻击下,水印依旧能够保持显著特征,显示其在恶意攻击下的鲁棒性。
THEMIS 框架的核心挑战包括:
1. 提取加密模型的难题:移动端深度学习应用中,部分模型采用加密存储,提取过程中面临文件分析、模型识别、动态提取等挑战。
2. 只读特性:许多模型在部署时被编译为优化格式,导致无法修改,只能进行推理。THEMIS 通过深度解析模型结构,使其具备写入能力,支持水印嵌入。
3. 仅推理特性:一些模型去除了反向传播能力,成为仅支持推理的模型。THEMIS 提出的 FFKEW 算法可以高效嵌入水印,无需重新训练模型。
THEMIS 框架提供了多项创新解决方案,为普通深度学习应用开发者提供了强有力的模型保护工具。
AI资讯
关税冲击下,全球AI向何处去?
自从特朗普4月2日提出的“对等关税”之后,国际局势持续动荡。博弈到今天,双方加征的关税率都超过100%,达到了前所未有的水平。面对巨大的政策黑天鹅,全球化程度较高的AI产业,不可能独善其身。
不过AI的特殊之处在于,此前美国为了限制中国AI发展的政策闸刀早已落下,比如海外AI算力禁运问题,如今国内已经有了相对确定的应对方案。
因此,当下这场突如其来的关税冲击,真正受影响的或许并不是早已处于禁运阴影下的AI供应链,而是全球AI产业为了应对不确定性,开始产生更深层的裂痕。
没有人能预测下一个黑天鹅,但所有人都知道存在黑天鹅。这会给全球AI开放、共享、伦理共识、产业协作等,带来更长远的影响。
这时候,我们必须尝试回答一个问题,全球AI产业接下来会如何变化?不妨先梳理一下AI产业的核心逻辑,预测对等关税冲击下的AI之变,最终是想探寻中国AI的应对之道。
想要全面洞察关税给全球AI产业链带来的挑战,我们首先有必要搞清楚,当前全球AI产业链分工,及其与全球贸易的紧密程度。
AI产业链可以简单分为基础设施层infra、技术层、应用层。其中,基础层的硬件芯片,依赖于全球半导体产业分工,因此与国际贸易的关系十分紧密,也会受到关税的直接冲击。
很多读者都有所了解,美国在高制程和AI芯片的设计和制造更为领先,中国硬件的国产替代也在加速,而欧洲在设备如光刻机,日韩在存储芯片、材料等,各有优势。所以,关税政策对全球多个国家的AI硬件进出口和AI基础设施建设,都会有影响。
技术层,大模型是当前全球AI技术竞赛的焦点,而模型的研发还依赖于基础软件框架、开源社区、技术标准协议等。这些虽然不会直接受到关税影响,但长期以来都是靠开源精神、国际标准组织、技术生态联盟等形式展开合作,而国际协作也可能因为贸易关系紧张导致的政治博弈而中断。
目前,全球AI技术生态大致处于“中美并行”的局势。以深度学习框架为例,美国TensorFlow(谷歌)、PyTorch(Meta)和中国PaddlePaddle(百度)、MindSpone(华为)并举,各有优势和侧重。比如海外框架更侧重学术和开发者,全球用户规模更庞大;而国内框架更侧重产业,实用性更强。在全球开源社区中,中国科技企业和开发者的贡献度、核心专家数量、代码数量等,近年来也快速上升。
所以,一旦开源模型或协议限制使用,就必须依靠自主技术生态了,意味着中美AI将渐行渐远。
应用层主要指的是AI产品,AI应用或AI终端被推向市场,关税可能导致市场的区域化,比如国产AI手机在美国市场的售价会增加,影响市场表现。AI技术作为应用或终端设备的核心竞争力,技术创新也有望降低成本,从而改变市场竞争格局。
总的来说,AI只是应用层的一环,关税政策影响到AI商业化的最终表现,需要经过一个很长的转化链条,并不能直接下结论。
了解了全球AI产业链全景图,也就发现关税对全球AI的冲击,比我们想象的覆盖面更大,但烈度或许比想象的要轻。
认清了全球AI产业链之后,我们就可以通过逻辑推演,来预测一下关税挑战的广度与烈度了。
从烈度来看,与关税政策紧密关联的AI硬件,成本会进一步增加,第三国转口供应链被进一步限制。但需要开导,特朗普在2019年签署行政命令促进美国AI发展,自此之后不断采取激进的政策遏制措施。为此,中国已经不断调整供应链,近年来在单体芯片、算力网络、AI云基础设施、异构智算等领域,加强自主研发,自主算力供应链已经有替代方案,并转向了区域内如日韩的合作。
总的来看,中国AI基础领域已经通过国产替代的冗余储备,打造了并行的技术生态,规避了对美国AI单一生态的依赖风险。
而且,对等关税也会推高美国本土AI企业的市场压力和成本,反噬本土AI基建,美国企业被迫将产能转回本土或盟友国,而这需要一定的建设周期来解决电力、人力、厂房、交通等,也可能拖慢其AI研发进度。这是科技巨头很难接受的,或许会与当局展开新一轮博弈。
所以,这次关税超过100%的数字看起来夸张,但实际烈度或许没有那么强。
但关税政策覆盖的广度,意味着对全球AI产业链的影响更广了。这对于全球化协作程度极高的AI技术来说,是一场地心深处的地震。因为中美AI渐行渐远,会导致以下风险:
1.中美技术生态割裂,知识共享受阻,技术交流断链。技术方面的交流中断,意味着更多重复探索,如果选错了技术路线,就可能像日本研发五代机那样,浪费大量投资,错失新技术机会。
2.人才和资金避险,AI产业出现“平行世界”。中美作为全球唯二的AI大国,人才、资金被限制正常流动,全美已有150名左右的留学生被突然取消了学生签证,必然会导致避险心理,主动“选边站”,那么全球AI的基础研究合作减少,技术上必然会重复造轮子,资金利用率降低,从而拖慢AI的进步速度。
3.双市场的标准冲突,影响国产AI出海。AI商业化离不开全球化市场,能否适配美国本土化要求,或者成功开拓美国之外的第三方市场,成为中国AI企业商业成功的现实挑战。
所以,关税冲击的烈度不大,至少不会对中国AI造成更严峻的挑战了,但它必然会导致中美AI技术生态的隔膜加深。这种技术上的双生态,将在全球AI产业链中引发看不见的地震。
智能时代的关键生产要素,不是土地、劳动力等传统要素,而是技术(芯片、算法、框架等)、资本、智力、数据。这些新型生产要素,都十分依赖全球化流动、碰撞、交流、分享。这意味着,对等关税冲击之下,全球AI或许站到了拐点。
不过,认清了挑战或许就能找到控制烈度、减少撕裂的方法,从而让全球AI在中美两股力量的牵引下,继续朝着AGI通用人工智能的目标前行。
如何应对风险?或许大家已经可以从前面的分析中,得出一些答案了:
基础层的硬件供应链,中美不得不各自寻求替代方案,比如中国加强自主芯片研发,美国可能推动本土制造,来减少关税带来的成本上升。
技术层的基础能力中,通用大模型是大家比较关注的,尤其是deepseek之后,国产大模型的重要性与先进性,无需赘述。但更底层的深度学习框架、高质量语料库、基础开发工具的国产化,是大众用户看不到的、容易被忽视,但AI不能追风口,这些基础能力也必须持续加强推广建设,避免冲击烈度上升后的断链。
应用层的AI产品化、商业化,离不开广阔的全球市场,中国AI也绝不能关起门来故步自封,必须走出去与国际AI产业伙伴保持合作与沟通。而且,大模型以来中国AI应用、企业、人才都在全球市场有突出的表现,比如deepseek、海螺AI、昆仑万维等,具备AI第一梯队的全球化竞争力。走出去,一方面可以扩大AI应用范围,规避与全球AI技术交流中断、押注错误技术路线的风险;同时,开拓美国之外的第三方市场,规避关税冲击。
此外,由于对等关税大棒给全球经济体都造成了冲击,由此产生对美国技术生态体系的不信任,或许也是一个中国AI合纵连横的窗口期,来增强中国AI技术生态的韧性,比如,吸引海外开发者使用国产化AI框架、开发工具、AI云服务等,来增强国产AI基础生态的繁荣度。给世界一个更包容、更可信的技术生态选择,这也是中国AI有能力、有责任去做的。
AI资讯
终究是Google和Anthropic,扛下了连接一切Agent的所有
Google Cloud Next '25大会上,Google展示了其在AI军备竞赛中的强势地位,尤其是其对AI Agent未来潜力的押注。Google推出了Agent2Agent(A2A)协议,旨在解决AI Agent间的互操作性问题,打破不同AI Agent之间的孤岛现象。A2A协议与Anthropic的MCP协议形成了直接竞争关系,后者已经提出了通用的模型上下文协议,解决了大模型与数据源之间的隔离问题。
A2A协议的核心目标是让不同来源和框架的AI Agent能够安全地进行信息交换和协作。通过基于JSON格式的Agent Card,A2A协议实现了任务管理和跨系统、跨领域的Agent协作。Google还推出了Agent Development Kit(ADK),这一开源工具框架旨在帮助开发者快速构建功能性的AI Agent。
除了A2A协议外,Google还推出了多个工具来加速Agent应用的普及,例如Code Assist和Firebase Studio。这些工具的推出标志着Google在AI编程助手和低代码开发平台领域的进一步布局,推动AI Agent成为更多应用的核心组成部分。
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_3e6b1003b98d4910820c478fdb5cae56@46958_oswg77371oswg750oswg578_img_000.jpg)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_72f4bb949f80453398324c374b2e1271@46958_oswg150454oswg750oswg251_img_000.jpg)
"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_36027e9b734544aab0811b15c74c7e26@46958_oswg55314oswg750oswg318_img_000.jpg)
"Image 4" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_9bad87cf5da24f3eb98546d8ea59a9a1@46958_oswg102053oswg750oswg534_img_000.jpg)
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_60d2cbd3a0b94156bf635c78520256cc@46958_oswg527764oswg750oswg466_img_000.jpg)
AI资讯
腾讯:从抠门的回购谈起,超级AI是明晃晃的阳谋?
腾讯的Q4业绩在AI背景下发布,但其实际结果未能符合市场预期。尽管资金分布面临挑战,腾讯的股价在港股市场下跌近4%。重点问题在于腾讯的800亿回购和900亿资本开支计划,尤其是这些计划未能让价值投资者和算力产业链投资者满意。腾讯的资本开支预算已经达到比去年翻倍的增长,但部分股东回报却减少。尽管如此,腾讯的资金配置策略依然偏谨慎,资本开支和股东回报之间的平衡成为争议焦点。
腾讯目前正在加大AI投资,但仍采取审慎的资金管理态度,预计未来会继续保持这种节奏。特别是在2025年,腾讯在资本开支上有较高的缓冲带,可能会将更多资金投入AI相关领域。相比Meta,腾讯在资金配置上更注重精细管理,而不是像Meta那样倾向于同步增加股东回报和投资。
关键观点
1. 腾讯的2025年资本开支预算达到720亿至1080亿人民币,较去年有所增加。
2. 腾讯对外投资的回报率依然较为保守,导致部分股东的不满。
3. AI的投资成为腾讯未来发展的关键领域,尽管在资金使用上仍保持谨慎态度。
文章中的图片链接
"Image 1" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_ceac410dfa4a45dc9e4aebfeeb9eb9fa@000000_oswg143864oswg1080oswg539_img_000.jpg)
"Image 2" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_43eba46a03554f5783d478a01e0e8f2f@000000_oswg144191oswg1080oswg518_img_000.jpg)
"Image 3" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_36f9f964c54d4758930356ef26277b72@000000_oswg136821oswg1050oswg528_img_000.jpg)
"Image 4" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_cdbc65da142343ed91d99c346bc3a573@000000_oswg135013oswg1080oswg510_img_000.jpg)
"Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_7dbab13d008d484795196052ee1bfeaf@000000_oswg219933oswg1080oswg510_img_000.jpg)
"Image 6" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_9c7000ec67e049a58894c9e4cab1114f@000000_oswg179439oswg1080oswg464_img_000.jpg)
"Image 7" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_78af44ab4e714369be2422c2cc6694b9@000000_oswg235451oswg1080oswg516_img_000.jpg)
"Image 8" (https://img.36krcdn.com/hsossms/20250411/v2_78af44ab4e714369be2422c2cc6694b9@000000_oswg235451oswg1080oswg516_img_000?x-oss-process=image/format,jpg/interlace,1)
AI资讯
零营销估值达100亿美元? Cursor的AI编程颠覆者之路
在全球 AI 技术日益成熟的大背景下,初创企业 Anysphere 以其自主研发的 AI 编程助手 Cursor,再次证明了技术颠覆传统开发模式的巨大潜力。Cursor 自成立以来,凭借独特的产品战略和技术优势,实现了在零营销投入的情况下,年收入从零飙升至 1 亿美元 ARR,并在短短时间内突破 2 亿美元营收。
"Image 7" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_df11752be69442a287d718fe0389afd7@813924438_oswg440333oswg1080oswg516_img_000.jpg)
Cursor 的成长轨迹令人瞩目,主要得益于超过 36 万名开发者用户的支持。该工具不仅提供免费代码补全机会,还通过精准的用户定位实现了收入的快速增长。
"Image 8" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_70b7ed3c32fd47a8b99d4201d700df9b@813924438_oswg86115oswg800oswg800_img_000.jpg)
Cursor 的成功离不开其全面的功能设计,产品具备自动完成代码、实时查错等能力,且在界面设计上借鉴了开发者熟悉的 Visual Studio Code,极大提高了工作效率。
多模型融合与智能预测
利用 OpenAI 的 GPT-4o、Anthropic 的 Claude 等先进模型,Cursor 能够精准预测开发者的操作,提供流畅的代码自动补全。团队致力于打造能理解程序员思路的助手。
先进的算法与缓存机制
团队采用 Mixture of Experts 模型和“speculative decoding”技术,提升了代码处理和响应速度。
突破传统、注重创新体验
Anysphere 的创始团队明确了突破 Visual Studio Code 局限的目标,通过不断优化解决开发者的实际问题。
"Image 10" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_8856b21504b3470f9bc4c353207a87ec@813924438_oswg926112oswg1080oswg706_img_000.jpg)
投资市场的盛赞与挑战并存
尽管 Cursor 表现亮眼,但在实际应用中仍面临一些挑战,如用户反馈生成代码时的中断问题,反映了 AI 工具在自动化与自主学习之间的平衡挑战。
"Image 11" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_59d23b9a117c428192d41179236bae5b@813924438_oswg41233oswg1080oswg567_img_000.jpg)
启示与思考:对国内 AI 初创企业的借鉴意义
Anysphere 的成功为国内 AI 初创企业提供了多方面的启示,包括精准市场定位、以产品说话、技术驱动与创新等。
未来展望:人机协同驱动编程革新
Anysphere 的 Cursor 展示了程序员与 AI 助手深度协同的愿景,未来将大幅提高开发效率,释放更多创造潜能。
AI资讯
AI版《猫和老鼠》刷爆外网,零剪辑自动生成,60秒神作刷新AI视频天花板
AI 版《猫和老鼠》刷爆外网,零剪辑自动生成,60 秒神作刷新 AI 视频天花板
最近,在短视频和社交媒体上,一个由AI自动生成的《猫和老鼠》视频在全球范围内引起了热议。令人惊讶的是,这段视频的时长为 60 秒,且完全没有任何剪辑,展现了前所未有的生成效果。过去,生成式视频的最大难题是时长,许多主流工具只能生成几秒钟的片段,而这次的AI突破将时长提升到 1 分钟。
这种技术的创新来自于伯克利、斯坦福与英伟达的联合研究。研究人员通过引入测试时训练(Test-Time Training,TTT)层,使得AI可以生成更长、更复杂的连续视频。在此过程中,传统的RNN(递归神经网络)层被一种更为灵活、动态的神经网络替代,这一设计显著提升了生成长视频的能力。
研究人员将《猫和老鼠》的81集经典动画作为素材,通过深度学习和自监督训练,AI能够理解复杂的时空依赖关系,生成连贯的故事情节。生成的视频中,AI不仅能够保留动画中的经典场景,还能模拟汤姆与杰瑞的复杂运动轨迹,例如急刹车、急转弯等。
这一成果展示了AI在视频生成领域的巨大潜力,特别是在动画和复杂场景的生成方面。通过不断调整神经网络参数,AI模型能够记住更复杂的场景变化,使得生成的视频在故事性和视觉效果上都十分出色。
"Image 18" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_b6b344fa66d5461fa59be755a71fb2cc@46958_oswg197531oswg531oswg657_img_000.jpg)
"Image 19" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_1a1a214c26834bb9b6fae52851ebead6@46958_img_000.jpg)
"Image 20" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_980030b8bb8d49039db59bb306821465@46958_oswg310308oswg904oswg453_img_000.jpg)
"Image 21" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_bf755b0ef93f46a3b86cdc734d466508@46958_oswg53182oswg903oswg306_img_000.jpg)
"Image 22" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/v2_5caee0b05c594bcbb797fcf48a5bd493@46958_img_000.jpg)
通过这一技术的突破,AI不仅能够生成高度一致和流畅的视频,还能够根据特定的剧本要求生成自然的运动场景,并模拟人物复杂的动态反应。