资讯
邦连接
创业服务
创业邦学园
在线课堂
天使基金
优企酷
邦出海
产业创新
城市创新
大企业创新
创投联盟
研究咨询
睿兽分析
活动
榜单
年度榜单
实时榜
搜索
公众号
登录 | 注册
个人中心
工作台
会员中心
我的邦积分
我的订阅
我的消息
创业邦
帮助创业者成功
快鲤鱼
发现最前沿的创新公司
毒舌科技
「毒」立思考的科技媒体
创业邦学园
创业者一站式成长平台
# 强化学习 #
文章
12
阅读
18.2K
关注
0
关注
前OpenAI CTO押注的赛道,被中国团队抢先跑通,AI「下半场」入场券人人有份
这正是 Mind Lab 真正布局的方向:让先进研究转化为可用工具,让中国团队在模型后训练与强化学习这一关键技术浪潮中,实现自主可控。
模型
强化学习
训练
01-04
刚刚,这家0产品0模型就估值854亿的公司,终于发布了首款产品!
微调大模型不再是少数人的专利!Thinking Machines Lab推出首款产品「Tinker」,一个专为语言模型微调而生的API。它让开发者能彻底摆脱底层架构的束缚,仅用简单的Python代码便可专注于算法与数据创新。
模型
微调
强化学习
2025-10-02
AI Agent迈向中央舞台:深度解析2025年进化新格局
AI Agent赛道还有哪些机会?
能力
强化学习
语言模型
科技
AI Agent
2025-05-26
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
在人工智能和机器人领域享有盛誉的专家 Pieter Abbeel ,不仅研究成果在学术界产生了深远影响,他带出的学生在不同领域也取得了非凡成就。
研究
强化学习
伯克利分校
人工智能
科技
2025-03-15
DeepMind元老创业AI编程:亮相即获1.55亿美元,英伟达红杉抢着投,团队太豪华了!
要做「AI编程助手界的Waymo」
强化学习
超级智能
博士毕业
2025-03-08
阿里半夜开源全新推理模型,QwQ-32B比肩DeepSeek-R1满血版
参数量为 320 亿。
强化学习
阿里
科技
2025-03-06
是个车企都要蹭DeepSeek,属实有点幽默了
歪了,真歪了。
强化学习
智驾
汽车
2025-02-12
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
就在刚刚,网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现,只用强化学习,没有监督微调,30美元就能见证「啊哈时刻」!全球AI大模型,或许正在进入下一分水岭。
强化学习
自我反思
2025-01-27
强如Operator也怕验证码,1450元花得值吗?第一波实测来了
让Operator登录ChatGPT调用Operator会怎样?
Operator
强化学习
科技
2025-01-25
DeepSeek新模型大揭秘,为何它能震动全球AI圈
真正的理解来自于主动建构,而不是被动接受。
模型
训练
强化学习
2025-01-23
大学教授跳槽腾讯,用1年时间解决行业难题?
广阔天地,大有作为。
强化学习
团队
游戏行业
2024-03-27
DeepMind的新研究:人类最后的自留地失守了?
这或许是向AGI迈进的一大步。
智能体
强化学习
能力
2023-12-12
热门文章
1
春节档狂降37%?不,AI洗牌才是真“震撼”
2
再投12400亿!谷歌,冲击全球AI“王座”
3
啊?今年春节,爸妈反过来教我用 AI?
4
这座玩具小城“拿捏”当代年轻人
5
史上经济回报最高的冬奥,各代表团金银铜都奖多少钱?
6
2026,投资人“风水胡诌”指南:马年,你有几个IPO?
7
办公桌放铀棒、0股份掌权7500亿:福布斯万字还原真实奥特曼
8
又一美丽智商税?华为耳机的耳夹营销打动了谁?
9
旅游界胖东来,被全国游客报复性消费
10
你总刷到的邪修番茄酱炒蛋,是这家公司悄悄赞助的
反馈
联系我们
创业邦公众号,带你随时了解与创业有关的人、事、钱
关注创业邦视频号,换种视角看创投
关注创业邦抖音号,换种视角看创投
关注创业邦小红书,尽知天下事
推荐订阅