计世网

爱、乐、惊、怒、恐、哀?爱奇艺喊你参加剧本角色情感识别挑战赛
2021-09-23
爱奇艺携手中国计算机学会,发起剧本角色情感识别挑战,诚邀全球英才组队参与。

 

剧本对影视行业的重要性不言而喻。一部好的剧本,不光是好口碑和大流量的基础,也能带来更高的商业回报。作为影视内容生产链条的第一环,剧本分析对于好剧本的选择至关重要,在这其中,角色的情感识别又是剧本分析中一个举足轻重的任务。

9月16日,CCF大数据与计算智能大赛第九届正式启动,爱奇艺携手中国计算机学会,发起剧本角色情感识别挑战,诚邀全球英才组队参与,探讨技术难题和行业痛点,这也是业内首个基于剧本的角色情感识别挑战赛。

基于剧本的角色情感识别主要是依托剧本中每句对白和动作描述,对相关角色进行多维度分析,并识别出情感。相对于常见的新闻、评论性文本的情感分析,有其独有的业务特点和挑战。

爱奇艺一直致力于为用户提供更多更好的优秀内容,本赛题也基于爱奇艺业务场景提出,需要参赛者利用自然语言处理和相关的技术手段,来对剧本中存在的多种情感元素进行综合判断和识别。

针对这次挑战赛,爱奇艺商业智能部的高级总监冯长晟表示,内容品质的提升,既依靠艺术工作者的创作和创新,又依靠技术能力的革新和发展。“影视工业化”将是下一个十年中,提升内容品质的关键推动力,而剧本评估系统是“影视工业化”中最为基础也非常关键的一环。本次大赛的题目,就依托剧本评估中情感的分析和分类来进行研究。剧本所富含的情感是剧本的灵魂,一个好的剧本总包含着充分的情感释放,情感分析正是剧本评估中非常有意义的一个方面。

CCF大数据与计算智能赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。本次2021年CCF BDCI第九届大赛以“数引创新,竞促汇智”为主题,立足余杭、面向全球,欢迎各路精英选手前来参赛。

赛题概览

爱奇艺为本次挑战赛准备了一部分剧本场景作为训练集,训练集数据已由人工进行标注,参赛队伍需要对剧本场景中每句对白和动作描述中涉及到的每个角色的情感从多个维度进行分析和识别。

本赛题的情感定义共6类(按顺序):爱、乐、惊、怒、恐、哀;选手可以根据上述6类情感按固定顺序对应的情感值,情感值范围是[0, 1, 2, 3],0-没有,1-弱,2-中,3-强,以英文半角逗号分隔;本赛题算法评分将采用常用的均方根误差(RMSE)来计算评分,按照“文本内容+角色名”识别出的6类情感对应的情感值来统计。

和其他类文体相比,剧本类文本行文风格和通常的新闻类语料差别较大,更加口语化,同时,剧本场景中的对白和动作描述都涉及到角色的情感,而且要从6个维度进行识别,难度也更高;再加上剧本中角色情感不仅仅取决于当前的文本,对前文语义可能有深度依赖,很容易出现识别错误。

赛题赛程

本次大赛已于9月16日正式启动。正式赛共计3个月,采用初赛、决赛、总决赛“三级赛制”,具体赛程安排如下:

动心了吗?关注“爱奇艺技术产品团队”动态,即刻组队,参与报名!

责任编辑:刘沙