4006-998-758
新闻动态

‘AI+人’访谈录 | 曲径通幽 老刘与AI的不解之缘

2024-04-07

 智灵姐 中智凯灵 2024-04-03 19:32 

图片

在AI的浪潮中,有人选择直接投身其中,有人则经历了曲折的探索之路。初见老刘,自律严谨是他的核心关键词。稍微有些诧异的是,他身上有传统研发人员少有的书卷气,带着这样的疑问,今天,我们有幸采访到了这样一位“曲线救国”的AI研发者——老刘,他用自己的经历诠释了在科技与人文的交叉路口,他与AI的不解之缘。

图片

老刘——原名刘焕勇,360人工智能研究院知识图谱方向算法负责人,曾就职于中国科学院软件研究所。主要研究方向为大模型数据挖掘与自动化评估、领域知识/事件图谱的构建与落地应用,申请发明专利十余项、论文数篇。近年来在OGB-Wikikg2、CCKS多模态实体对齐等评测中获得多项冠亚军。

老刘是一位在AI领域有着丰富经验的研发者。他不仅在学术界有所建树,在工业界也取得了不俗的成绩。如今,他致力于知识图谱与大模型的融合增强、RAG问答、文档跨模态大模型的研发工作。那么,他是如何走上这条AI研发之路的呢?听听老刘的自述。


曲径通幽

——与AI的不解之缘

文、理、工背景加持,为走上AI研发的职业发展路径,增添不确定性和戏剧性色彩。

图片
(时间背景:2010年)

我大学攻读的是信息与计算科学,这个专业当时隶属数学系,数学专业课和计算机专业课都要学。但时间久了,逐渐发觉数学索然无味,并没有太大的兴趣,反而喜欢上了文学,大学时候还写过诗。因此,在大四毕业的时候,就直接以理科的背景跨专业考研到北京语言大学,攻读语言学专业。当时专业课包含古代汉语、现代汉语以及语言学纲要,跨度真的蛮大。

(时间背景:2014年)
戏剧性的是,到了北语,读的方向是语言信息处理,学了语言学和词汇学这些课程之后,发现也很索然无味。例如:从词汇语法学的角度来分析“我吃饭了”和“我吃了饭”这两个句子之间有什么差异,又要通过词汇分析的角度来分析一些社会事件、社会现象,这些又存在着很多的主观性解读的问题。
(时间背景:2017年)
为了更纯粹地去做一些直接呈现的工作(如数据挖掘),选择了知识图谱这个课题,这在当时是一个比较新的研究方向。在中国科学院软件研究所更深入地做一些知识图谱的算法工作,比如金融知识图谱、因果事理图谱,这样又慢慢地回到工科上来。同时也做了一些使用传统、深度学习模型来解决NLP课题的开源项目。
在中国科学院待了几年之后转到工业界,在360人工智能研究院做知识图谱算法的工作,以及右侧推荐和知识图谱平台等建设性工作。随着大模型的兴起,加入到360智脑的研发当中,逐步聚焦到当前知识图谱与大模型的融合增强、RAG问答、文档跨模态大模型的研发上,与AI越绑越深了。
就这样,弃理从文再转工,我从与AI八竿子打不着的学科方向,转而投入到大模型与知识图谱技术研发的浪潮当中,经历了一个相当“曲线”的过程。但是冥冥之中,文理工背景的加持,以及最后转向AI,又存在着某种必然。本科阶段的数学底子,养成了一些“理科”思维。研究生阶段的语言学基础,又让我跟常规纯粹计算机出身的人相较,有了不一样的语言学认知。而在学术界、工业界的一些工程编码、算法设计等研发实践,又夯实了“工科”的根基。“文、理、工”三种背景加持,反而让我在AI的探索中游刃有余。在AI 探索的过程中,不给自己设限,自始而终地垂直在某一件事上,每天在完成业务和研发任务之余,通过阅读知识图谱+大模型相关的技术文献并总结沉淀成文章,这对提升自己对AI的理解和边界认知带来很多收益。

保持好奇

——与AI共舞的日子

用好奇心去感知世界,用自律去塑造自我,用坚持去实现梦想,这样的人生才能充满意义和价值。

从2014年接触NLP至今,这十年间,最让我感到兴奋的有两件事。
一个是在2017-2020的三年间,做了近70个开源项目(https://liuhuanyong.github.io,https://github.com/liuhuanyong)。这些开源项目很简陋,原则上也不能称之为项目,但每个项目都来源于自己解决某个NLP问题的实践,例如常识推理、知识问答、知识图谱、语言资源、语言工具、信息抽取、信息采集、文本计算等。
图片
(得语言者,得天下)
值得注意的是,其中的医疗知识图谱问答(https://github.com/liuhuanyong/QASystemOnMedicalKG)还收获了很多stark和fork数,并且在githubrank中国区(https://wangchujiang.com/github-rank/users.china.html)排名第74位。
图片
说实话,国内的开源氛围还是令人担忧的,完成这些开源项目后,很多成果只是单纯地被伸手党clone。思前想后,“授人以鱼,不如授人以渔”,与其投喂项目代码,倒不如给出一些建设性的思路,以及一些技术思想的普及。因此,自2021年始,开始从开源社区转向第二战场,创立“老刘说NLP”,做了关于知识图谱、大模型的很多专题,也输出了许多想法,做了一些粗浅知识的普及,并以此与Github这个战场进行融合,以实现更大的价值。
另一个是在中国科学院软件研究所的事理图谱工作。时值2019年,为了解决在金融场景中进行事件驱动的决策,我们开始了基于开放金融文本进行因果事件逻辑的挖掘工作,这在当时也是为数不多有着一定影响力的项目。我们对事理图谱做了许多工业应用尝试,并推出了实时事理逻辑结构化搜索引擎《学迹》以及《数地搜搜》,很受欢迎。这反映了对于使用逻辑推理知识库来完成一些特定的推理场景,是有实际需求的,这是我当时觉得特别有意义的一件事儿。
这几年围绕着“知识图谱+”,通过持续的耕耘开源社区、坚持写作、算法研发,产出了一些具有影响力和价值的内容,看到了“滴水穿石”的巨大力量,这也是对我人生的一种历练。这些坚持来源于对知识图谱领域的专注和热爱,高度自律,时刻保持谦逊,时刻保持好奇心。“图难于其易,为大于其细”,一件事,只要坚持下去,深入到细节里,持续投入下去,一定会有结果。

科技向善

——大咖的独特视角

如果科学技术要发挥杠杆作用,它就要以人为本,以关心人与社会的人文价值为参照,着眼于真正为人类增进福祉,并形成广泛的共识、协作与行动,才可能推动社会可持续发展。

人工智能的发展进入2023年以来,呈现出一种井喷式的发展势头。从ChatGPT横空出世到“百模大战”,再到Sora和人形机器人的出现,相较前几年,发生了翻天覆地的变化。越来越多AI智能化生产工具诞生,比如作图工具、作曲工具、写作工具,这将迎来一个真正的全民创作时代。“科技向善”,这种科技生产力如果不加监管,就会成为一把双刃剑。
AI可以生成真假难辨的视频、图像、文字,一方面,它可以在情感陪护上起到一些作用,能够在虚拟世界里重现一些信息;另一方面,这些工具也会带来许多欺诈、虚假的信息,在诈骗、内容生态污染上会是一个很强的推手。因此,我们对AI这个先进生产力,需要抱有一种敬畏之心,合理地应用它,不乱用,不滥用。
AI技术的未来,在实现技术上应该会朝着多模态、大容量的统一建模方向发展。这里的多模态指的是能够在统一框架下,同时接收视频、图片、音频等信息,彼此交互,最终产生决策。
尽管AI已经取得了长足的进步,并且不断地刷新大家对其能力边界的认知,我们需要明白的是,AI生产力的广度和深度依旧是有限的。尤其是在一些数据量较少的垂直场景,其应用精度并不高,依旧需要大量的人工参与。随着AI的发展,人工参与的比重会降低,但不会完全脱离。
总的来说,AI是一种变化迅速,并且会持续变化的新生产力工具。但其当前还并未达到无所不能的高度,还需要持续迭代。也正因如此,我们要敬畏它,探索它的边界,用好它,最大化其价值。

融会贯通
——人生哲学与AI思考
底层原理是道,应用开发是术。道术结合,兼济天下。有道无术,术尚可求也。有术无道,止于术。

AI的发展其本质上就是新的生产力革命,并且会一直持续下去,其诞生的目的就是为了提高人类社会的生活便利性和工作效率。有一些媒体鼓吹AI会替代人类工作者,这在某种程度上只是吸引眼球的一些说法。实际上两者并不是替代关系,AI反而会激发更多的创造力,促使涌现出更多的新机遇和新职业。
面对AI对人类工作者的冲击,我认为最有效的方法就是自我提升。我的人生哲学可以总结为16字:“踏实成长、专注自律、长期主义、谦虚好奇。”这些人生哲学同样也是我在AI研发工作中的准则:
1、踏实成长。只有踏踏实实的钻研技术,才能够有所沉淀,有所成绩。
2、专注自律。专注地做一件事,胜过敷衍地做很多事。垂直扎根于一个领域,深入思考,并持续地投入精力,才能挖的深。
3、长期主义。快速发展的技术在落地过程中,会出现许多阵痛。这个过程不会一蹴而就,顺风顺水。真正的长期主义者一定是于大处着眼、小处下手的。在研发过程中坚持长期主义的定力,才能真正意义上不陷入到短期当中。
4、谦虚好奇。研发人员很容易陷入到“拿着锤子找钉子”的怪圈当中,这个时候,更需要跳出技术思维,有一定的产品思维。AI研发不需要太天马行空和发散,通常需要有一些边界感。

老刘的职业生涯并非一帆风顺,他经历了从数学到文学,再到语言信息处理,最后聚焦到AI研发的曲折过程。然而,正是这些经历,让他拥有了跨“文理工”学科的背景,为他在AI领域的发展奠定了坚实的基础。
感谢老刘接受我们的采访,也期待他在未来的AI研发道路上取得更多的突破和成就。同时,我们也希望更多的人能够不断拓宽对AI的认知拾级而上,努力拥抱变化,并确保科技向善,践行普惠。




END




4月10日晚八点,老刘将与腾讯技术专家揭光发、Zilliz AI & ML 负责人Frank Liu,共同做客K+Talk直播间,与大家一起聊聊《RAG的窘境与长文本之争》,欢迎扫描下方二维码预约观看!
图片

2024最值得关注的AI研发峰会

报名火热进行中!

为助力更多企业在人工智能的浪潮中乘风破浪,“AI+研发数字峰会(AiDD)”应运而生,旨在帮助更多企业借助AI技术,使计算机能够更深入地认知现实世界,推动研发全面进入数智化时代。

图片


AiDD峰会火热报名中。届时,老刘将作为演讲嘉宾带来《大模型在360云盘数字化转型中的应用探索 》主题演讲。扫描上方“二维码”或点击“阅读原文”,了解更多峰会详情!


图片


返回列表