澳门尼威斯人8311对话数十位学术合作代表:如何提升前沿技|99e热在这里只有精
发布时间:2023-05-27 来源:澳门威尼斯人官网
从去年火出天际的元宇宙ღღ,到今年年初的现象级应用 ChatGPTღღ,科技圈似乎从不缺少热门的技术概念与话题威尼斯官网ღღ,ღღ。尤其是在云计算ღღ、人工智能ღღ、大数据等技术呈爆发式增长的背景下ღღ,我们愈发体会到前沿技术对于产业产生的深远影响ღღ,而这也延伸出了其他问题ღღ:前沿技术的边界在哪?如何与具体的应用场景融合?
以上这些问题或许看起来有些抽象ღღ、复杂ღღ,但我们从阿里巴巴创新研究计划(Alibaba Innovative Research, AIR)中ღღ,似乎找到了一些解决方案ღღ。自 2017 年开始ღღ,每年有大批全球顶尖高校 / 研究机构学者与阿里巴巴集团的工程师ღღ,就前沿技术问题展开研究ღღ,一方面促进学术研究深入产业ღღ;另一方面ღღ,AIR计划提供的开放性研究基金和实际的前沿场景ღღ,也有效助力了高校青年教师99e热在这里只有精品ღღ、学术人才的成长和优秀研究型学生的培养99e热在这里只有精品ღღ。
在过去的 2022 年ღღ,共有 15 个项目从众多申报项目中脱颖而出ღღ。近期ღღ,InfoQ 联合阿里巴巴集团采访了获奖项目的数十位优秀学术代表ღღ,以期深入理解校企合作的真正意义以及这对整个产业的未来发展带来了哪些影响ღღ。(文末附阿里巴巴年度优秀学术合作项目名单)
过去澳门尼威斯人8311ღღ,从基础研究到应用落地似乎是横亘在学术界和工业界的鸿沟ღღ,这种现象在人工智能领域尤为突出ღღ。举例来说ღღ,如果一个训练模型没有与实际业务场景磨合99e热在这里只有精品ღღ,很可能在各种因素的影响下导致正确率的折损ღღ。把其类比到学术界与工业界也是如此ღღ,如果高校只着眼于理论问题的研究ღღ,企业只是生搬硬套ღღ,前沿技术的落地情况自然也不尽人意ღღ。
阿里发起 AIR 计划的初衷便是在学术界与工业界二者间架起一座桥梁ღღ。从这几年的实践效果看下来ღღ,企业与高校合作或许是突破应用场景技术难题的结合模式之一ღღ。
通过 AIR 计划ღღ,高校可以直接定位工业界的痛点问题ღღ,再有针对性地进行算法研究99e热在这里只有精品ღღ,而企业则可以提供算法的落地场景澳门尼威斯人8311ღღ,来验证方案是否可行ღღ。两者通过不断的磨合可以定位实际问题ღღ、发现真实需求ღღ,达到有效的互动ღღ。
正如上海交通大学郑臻哲老师在接受 InfoQ 采访时提到的ღღ:“通过 AIR 计划99e热在这里只有精品ღღ,我们能接触到工业界的痛点问题ღღ,从落地应用的视角思考模型算法研究ღღ,进一步加强理论联系实际ღღ,做对学术界与工业界都有影响力的工作”ღღ。大淘宝技术团队和他一起把深度学习技术和工业界拍卖机制设计的结合做了很多探索和尝试ღღ,取得了很多理论和技术上的突破ღღ,同时也得到了学术界的广泛关注ღღ。
如果让我们评价前沿技术探索的实际价值?这个问题或许很难回答ღღ,也没有标准答案ღღ。但当一项技术在产业界产生实际价值时ღღ,前行者会实实在在感受到技术红利ღღ,以此为标准来看待这个问题似乎容易了很多ღღ。“关键性的技术突破虽然在技术上只是百分之几的变化ღღ,但带来的可落地场景却是十几倍的增加”ღღ。阿里巴巴淘宝技术团队的咏亮在采访时表示ღღ。
基于过去多年校企之间的协同ღღ,AIR 计划吸引了全球众多国家和地区的数百余所顶级科研机构参与ღღ,包括哈佛大学ღღ、斯坦福大学ღღ、苏黎世联邦理工学院ღღ、新加坡南洋理工大学等高校ღღ,中国高校与研究所申请总量的 80% 来自 985 高校和中科院ღღ,先后有十几位 IEEE Fellow 和 TR35 与阿里巴巴合作ღღ,相关成果通过论文ღღ、专利ღღ、项目等形式让产业从中受益ღღ。
上述提到的优秀学术项目ღღ,为何能取得基础理论和落地应用的双突破?双方打好配合ღღ,或许才是让合作价值最大化的关键ღღ。InfoQ 基于对多位优秀学术专家的访谈ღღ,总结了三点校企合作的实践经验ღღ:
第一ღღ,双方要找准自身定位ღღ。来自浙江大学的尤伟涛有一个很强烈的感慨ღღ,他认为ღღ:理论研究不仅要上天也要入地ღღ,高校做学术时也要考虑应用ღღ,否则落地就会很困难ღღ;企业也要明确定义出问题ღღ,找出学术价值ღღ。对此ღღ,大淘宝技术吕承飞也表达了相似的观点ღღ:“命题需要来源于业务又高于业务ღღ,提炼出科学理论问题是尤为关键的一步ღღ。”
第二ღღ,在优势互通的基础上ღღ,打破思维定式ღღ。就如同上文所言ღღ,高校与企业思考问题的角度其实是不同的ღღ,如果各自为营ღღ,两者之间的鸿沟只会越来越大ღღ,但如果大家能在不断磨合中ღღ,持续碰撞思路更有利于双方互通有无ღღ。
拿《端云协同超大规模分布式推荐系统的算法研究和系统实现》的推进过程举例ღღ,凭借云侧大规模模型实时训练和端侧动态感知用户的双重优势ღღ,“端云协同学习”成为了业内备受关注的焦点ღღ,并被阿里巴巴达摩院列为 2022 年 10 大技术趋势之一ღღ。然而在热潮之下ღღ,校企双方在推进时也遇到了一些挑战澳门威尼斯人官网ღღ,ღღ,“千人千模”中小样本学习过拟合便是其中之一ღღ。
受限于端侧只有单个用户的浏览量ღღ、点击量等数据ღღ,如果只根据用户自己的数据对模型训练ღღ,便会遇到中小样本过拟合的问题培训课程ღღ,ღღ。上海交通大学吴帆提到ღღ:“一开始我们其实被这个问题绊住了ღღ,很难突破本地数据的限制ღღ。”但在研究过程中逐渐发现ღღ,虽然原始数据不能离开本地ღღ,但数据特征ღღ、训练参数以及一些中间的结果是可以离开本地的ღღ,需要把云作为中心服务器的协调特性发挥出来ღღ。最终ღღ,双方打破了之前的思维定式ღღ,有效地解决上述问题ღღ。
第三ღღ,校企双方在资源上的协同也是项目成功的另一关键要素ღღ。InfoQ 在采访《端云协同超大规模分布式推荐系统的算法研究和系统实现》的专家代表吕承飞时了解到ღღ。目前ღღ,这套体系可以在搜索ღღ、推荐ღღ、内容理解等场景中应用ღღ。
而双方的合作能够取得如此亮眼的成绩ღღ,一方面是源于双方对于端云协同技术方向的一致认同ღღ,他们认为端云协同可以有效解决人工智能服务最后一公里的问题ღღ,也是人工智能进一步发展的必要支撑ღღ;另一方面ღღ,还离不开阿里在基础设施平台的背后支持ღღ。通过阿里巴巴机器学习基础设施 Walleღღ,实现了数据在端云之间的传输ღღ,最终才让端云协同发挥出了最大价值ღღ。值得一提的是ღღ,大淘宝技术团队还在论文中详述了阿里自主研发 Walle 的实现过程ღღ,该论文目前已入选了计算机系统领域顶级国际学术会议 OSDIღღ,这也是淘宝系统论文首次入选该国际顶会ღღ。
如果说校企的高效协同是优秀学术项目取得亮眼成绩的充分条件ღღ,那么日积月累的磨合则是双方发展的必要条件ღღ。
InfoQ 在和优秀学术项目的专家代表沟通时了解到ღღ,大多数项目的推进时间都在 3-5 年左右ღღ,AIR 计划更是陪伴了一大批学者经历了从早期起步到逐渐成熟的阶段ღღ。例如ღღ,浙江大学的尤伟涛老师在博士阶段就参与到了 AIR 计划中ღღ;上海交通大学的郑臻哲老师也是在博士后阶段就开始参与......正是这种“坚持长期主义”的精神ღღ,让我们看到了探索前沿技术的巨大价值空间ღღ。
在这一点上ღღ,《数字创意内容的智能设计》无疑是一个具有代表性的学术合作项目ღღ。伴随着大模型技术的成熟ღღ,AIGC 在近期火出新天际ღღ,但实际上这个技术并不是刚刚诞生ღღ,其已经有七ღღ、八年的发展时间ღღ。浙江大学 尤伟涛ღღ、李泽健 & 设计事业部不饱几年前就在 AI painting 领域进行探索ღღ。虽然现阶段实现了设计领域的应用党建活动ღღ,支持了鹿班平台产品的功能升级ღღ,但实现的过程中其实需要长期的尝试和验证ღღ。
阿里巴巴设计事业部的不饱提到ღღ:“针对一个痛点问题ღღ,高校即使提供了多种解决方案ღღ,但企业在实际落地时会发现ღღ,以上方案或许都不能在业务中取得成果ღღ。所以双方在解决科技问题的路上ღღ,其实没有捷径可以走ღღ,每一位参与者都要有这种心理认知ღღ。”
正是基于长期的投入ღღ,双方才在业务上取得不错的成果ღღ。在本次《数字创意内容的智能设计》中ღღ,面对“设计知识和大数据难以结合ღღ、设计创意难以形式化表征ღღ、跨媒体情感难以统一表达”等技术瓶颈ღღ,项目团队开创性地提出了结合设计经验法则和设计大数据ღღ、引入因果推理ღღ、支持视听融合的智能设计方法ღღ,提出了原型理论支撑的智能设计技术和创意因果推理支持的智能设计技术等ღღ。目前ღღ,该项目的智能设计能力已经接入鹿班生产平台ღღ,可以快速生成多样化的风格背景图片ღღ,节约设计生产成本学术合作ღღ。ღღ,并且已经帮助成功孵化了鹿班平台中的互动视频产品ღღ。
针对《数字创意内容的智能设计》学术项目而言ღღ,虽然目前已经取得了小阶段的研究成果ღღ,但双方的合作并不会就此止步ღღ。三位专家在采访时表达的一致观点是ღღ:“随着虚拟空间等新载体以及新技术的出现ღღ,一定会产生新的生成素材的需求”ღღ。因此ღღ,与虚拟 3D 相关的设计素材生成依然是后续规划中的重点方向ღღ。除此之外ღღ,随着业界对于 AIGC 的接受度越来越高ღღ,后续也计划将这些能力更多地运用到实际的业务场景中ღღ。
不仅于此ღღ,校企合作在应用层面取得落地成果的同时ღღ,还会在前沿技术上进行不断地探索ღღ。以近期大火的 ChatGPT 为例ღღ,在云计算成为稳定的基础设施的背景下澳门尼威斯人8311ღღ,学术界与工业界已经开始向智能化迈进ღღ。具体到智能化背后的技术和应用ღღ,受访嘉宾在大模型技术的探索与融合方面提出了一些前瞻共识ღღ:
一方面ღღ,对于统一的基础大模型而言ღღ,预计 3 年内将有上千个不同的任务都基于同一个基础大模型ღღ,再结合上 RLHFღღ,AI 技术的应用门槛会进一步大幅度降低ღღ;对于预训练大模型ღღ、视觉大模型等细分层面而言ღღ,预计未来将能在节省训练时间的同时ღღ,不断提升模型的精准度ღღ;
另一方面ღღ,受访专家也针对模型的融合层面作出了进一步的预测ღღ,知识图谱与神经网络大模型将进一步互为补充与深度融合ღღ,大规模符号知识的神经网络化催生知识感更强ღღ、知识交互更符合人的预期的人工智能ღღ;针对算法模型与系统部署而言ღღ,算法模型设计与系统优化调度将紧密结合ღღ,形成算法与系统互为反馈的新工业界机器学习迭代研究的新模式ღღ。
除了业务应用和前沿技术探索ღღ,AIR计划的一些项目也在更大的社会范围内发挥着越来越重要的作用ღღ。例如ღღ,澳门大学周建涛老师和阿里安全线杨锐合作的《抗媒体传输的高鲁棒伪造图象检测与定位研究》ღღ,设计了一套可以有效对抗社交网络传输ღღ,且具有高泛化鲁棒性的图像取证技术ღღ。其伪造图像取证模型的性能远优于现前沿算法ღღ,可在多维度干扰下保持稳定ღღ,有望大幅降低各类噪声对伪造检测与定位框架的负面影响ღღ。目前这个“假图粉碎机”网站对公众开放ღღ,相应技术正在持续迭代ღღ,还计划将部分技术开源出去ღღ,促进图像篡改检测技术的进步ღღ。
一项前沿技术要想掀起真正的技术浪潮ღღ,不仅要在理论方面取得突破ღღ,还需要创造出坚实的商业价值和实用价值ღღ。在此过程中ღღ,仅靠学术界或工业界一方的探索是远远不够的ღღ。如何能让学术界与工业界更加紧密地联系起来澳门尼威斯人8311ღღ,是行业内共同的努力方向ღღ。
目前99e热在这里只有精品ღღ,阿里巴巴集团作为行业的先行者ღღ,通过 AIR 计划让工程师从业务中定位问题ღღ,再与学术研究专家共同携手来攻克问题的模式ღღ,大大提高了前沿技术在商业领域的落地应用率ღღ。同时ღღ,AIR 计划还会向高校老师提供开放性的研究基金ღღ,开放实际的前沿场景ღღ,助力高校青年教师ღღ、学术人才的成长和优秀研究型学生的培养99e热在这里只有精品ღღ。
除此以外ღღ,我们也看到了 AIR 计划的另一个野心——着眼于前沿技术的未来发展方向ღღ:如同《数字创意内容的智能设计》早在几年前就开始探索智能设计方向99e热在这里只有精品ღღ,经过多年的磨合ღღ,双方的合作成果已经显现——让设计师能够聚焦解决核心创意任务ღღ;在《端云协同超大规模分布式推荐系统的算法研究和系统实现》过程中ღღ,上海交通大学吴帆与大淘宝技术吕承飞一直在端云协同方向持续投入ღღ,为了给用户提供极致的个性化推荐体验ღღ,后续还会将模型的轻量化ღღ、个性化做进一步的夯实......
以上提到的前沿技术ღღ,只是 AIR 计划的冰山一角澳门尼威斯人8311ღღ。但可以预见的是ღღ,随着校企双方的合作持续深入ღღ,不仅能够有效地打破学术界与产业界之间的壁垒澳门尼威斯人8311ღღ,更为前沿技术的蓬勃发展起到了一锤定音的效果ღღ,也希望这些技术能够带来更大的社会价值ღღ。