当一场浪潮来临,明智的选择是乘势冲浪。
近期,蓝驰创投开展了以「大模型应用」为主题的投后系列活动,邀请微软Azure首席架构师Alan Liu、百度AI中台产品解决方案架构师赵树理,为上百位蓝驰家族成员分享应用路径。
此外,我们还邀请了三位蓝驰家族成员:即时设计创始人李国锐、潞晨科技创始人尤洋、伊对创始人任喆,带来了足够一线实战的视角。我们提炼了近三个小时活动中你值得驻足的要点,以下enjoy:
| Q1:目前是怎么把大模型业务结合的?
李国锐(即时设计):
在SEO撰写、数据分析上,我们不再依赖大数据的开发,能够独立通过SQL数据库去查询;我们原先就会让开发用模型去写代码,但GPT会有一些难以测出的坑,所以后面开发会用它来编写单元测试,加各种代码注释;还有一些插件和小组件的开发。
尤洋(潞晨科技):
我们构建基础设施用到的算法比如张量并行、流水线并行,之前代码写起来很复杂,现在我们用Copilot、ChatGTP提高了效率。
任喆(伊对):
很代替人工对用户上传的UGC的内容进行合规审查。我们自研的语言处理和预训练处理模型效果突出。用第三方产品审核一万张图片的成本是自研产品的十倍以上,错误率完全满足我们的需求。
| Q2:应用大模型的阻力是什么?
Alan Liu(微软):
首先是审核或合规事务繁琐,客户不是一下单马上就能用。
在有大数据集的前提下,有些客户不知道这些东西是可以集成去做很多训练方式的。目前反倒要回到机器学习的概念,需要针对提示工程里头的prompt做筛选和处理;
一些客户不知道用哪种训练方式。第一种是interface,可以在界面上直接跟机器人交互。第二种embedding training,去改变它的向量,出来的训练效果不一定比interface好。第三,微调如果没有对prompt做处理的话,结果会很差。
尤洋(潞晨科技):
具体业务往往无法量化或者机器学习化。我们可以思考是否能把ChatGPT的能力发挥在制造业一些瓶颈环节上,通过在重要环节把任务定义好,使得ChatGPT能进行理解和推理。
任喆(伊对):
人力准备:在实际应用中往往遇到研究算法的只关注模型优化,实现后端集成的工程师只关注业务逻辑的情况。在大模型应用上,AI工程师不仅要了解企业的流程,并且能够调遣到各块的人。
第二,因为模型的质量跟高质量的语料库有关,数据的获取和清洗是有较大难度的,我们当时放弃Bert的主要原因就是找不到对应的数据集。
赵树理(百度):
最近遇到最多的问题就是什么时候能够接入。
| Q3:调用公开通用模型API还是自己做垂直领域专用模型?
任喆(伊对):
如果开发轻量级应用,只要能解决用户的问题就好,这时候API是最有效的方法。但如果要做更深层次的应用,对数据非常敏感或者很难交给第三方,那就一定要考虑私有化部署。
我认为会出现专门帮助企业做私有化部署的SaaS运营服务商,企业可以为了实现数据闭环构建自己的模型。以往我们没有那么重视数据资产,但今天我们可以通过模型化的方式保存,大模型可以将用户的无效数据变成产品的能力。
尤洋(潞晨科技):
我个人觉得以后会有很多用户会去构建自己的模型,甚至五年之后可能会有很多用户去训练自己的模型。模型训练的成本是下降得非常快的。
开源模型最终还会是主流,AI发展到今天最大的驱动力就是行业的开放。OpenAI没有太高的技术壁垒,相对于谷歌、Facebook等公司可能只是暂时处于领先。
赵树理(百度):
我们日常接触客户里面,私有化呼声最高的必然是政府部门或者央企国企。一些初创公司、信息化公司,一些做服务类的公司,他们对于服务的接入意愿非常强。
李国锐(即时设计):
我们本身还是OpenAI的API用的会比较多,然后自己也在用一些斯坦福羊驼模型,我们现在也想看国内有哪些大模型API可以选择使用。
| Q4:对组织人力产生了什么影响?
赵树理(百度):
首先是研发部门更忙了;百度内部的设计团队也在用我们的产品,效果非常好,还经常举行大赛,给内部做了提升。
李国锐(即时设计):
大模型对逻辑、情感方面是不是目前还缺乏理解?如果把它用在情感咨询业务方面,未来是不是能够产生比较大的影公司优化掉了部分整理材料、素材及做些简单的设计外包的人。我们能够很强地感受到一些多面手的能力变得更强了,以前他可能每个方向都知道一点,再运用大模型后他能够完成更多的事情。不过并不存在AI代替人类的恐慌,实际上从年初到现在整个组织并不是人数减少,只是说优化了一些边缘的需求。
Alan Liu(微软):
我上次去一家设计公司,他们老板对此特别感兴趣,说要替代掉百分之多少的工作量,底下的工程师瑟瑟发抖,我建议他们可以去做目前的AI办不到的事。我们应该去做更创新的工作,而不是在既有的知识上面琢磨。
| Q5:对大模型的未来发展有哪些期待?
李国锐(即时设计):
我们对多模态会更加期待,因为我们非常需要对视觉的解读、能够快速理解图片。我们现在更多是把文字转换成结果态,一旦能够对视觉型有进一步理解,对设计方向会有很强的能力加持。
Alan Liu(微软):
我比较期待大家用Codex做自动化处理,因为我发现太多的客户都还只是在进行文本处理,要做客服,太没意思。如果可以像飞书或者Copilot一样真正做一些自动化流程,才是底层企业集成很好的应用方向。
尤洋(潞晨科技):
AI的能力我个人最期待的还是它能在各个行业迅速开花结果。再有开源化的发展以及大语言模型的最终成本能够降下来,能够让千千万万的企业可以去部署甚至训练自己的AI大模型,这样才能把AI的能力充分地释放出来。
任喆(伊对):
医疗行业上,在生物制药和问诊上我看过两个产品,一个用于设计蛋白质分子,如果不用实验就能生成或推测,那生物制药可能会有大的改进。还有一个在问诊领域,通过给出的自然描述生成医疗计划,如果能有专业医疗团队以更可信的方式来做,是很不错的。
金融行业,彭博做了GPT,金融分析的数据可能以后就会由具有几十年金融数据能力和持续采集能力的企业形成超级闭环,分析将会变得极其简单高效。我非常好奇量化交易用人工智能来做会是什么样。
Social&Games这个行业会涉及很多有意思的东西,比如说群体模型的打造。我们上周看斯坦福做了一个社会模拟,25个人一起沙盒,这个东西找到具体场景应用后会很有意思。