摘要:在短视频、微短剧等新兴业态带动下,中国视听产业的全球影响力持续上升,正在成为全球视听领域的重要力量。统计数据显示,在去年全球下载量前100名的海外视听类应用中,中国视听类应用(含港澳台)贡献了超1/4的下载量份额,并创造了近30%的营收占比。
整理自 | 娱乐资本论、短剧自习室、新时代视听
在短视频、微短剧等新兴业态带动下,中国视听产业的全球影响力持续上升,正在成为全球视听领域的重要力量。统计数据显示,在去年全球下载量前100名的海外视听类应用中,中国视听类应用(含港澳台)贡献了超1/4的下载量份额,并创造了近30%的营收占比。
视听内容的出海,微短剧的贡献不可忽视。2024年,海外视听类应用收入规模前100中,中国(含港澳台)应用有20个,新入围11个,微短剧应用占8席。微短剧正成为推动中国故事走出去的“文化轻舟”。
目前,中国微短剧的海外应用已突破300款,全球累计下载量超过4.7亿次。以ReelShort、DramaBox、ShortMax为代表的头部出海微短剧应用,在主要目标市场稳居下载榜前三。中国微短剧产品已覆盖全球200多个国家和地区,形成以北美为重心,辐射欧洲、日韩、中东、东南亚等广阔市场的发展格局。
业内人士表示,从算力层面来看,AI对长视频制作仍存在算力瓶颈,但微短剧的制作已与AI的阶段性技术能力高度匹配。从此前的《中国神话》《山海奇镜之劈波斩浪》《三星堆:未来启示录》,到正在制作或即将上线的《新世界加载中》《资治通鉴》等一系列新作品,“AIGC+微短剧”的想象空间正越来越大。
此外,不少AI大模型已可实现声线提取、原字幕擦除、配音、外语字幕生成等功能,不仅内容翻译准确,还能“克隆”剧中人物的语音语调。相关产品负责人表示:将AI大模型用于影视作品翻译,成本较人工可降低为1/15,速度则提升了10倍。
1
译制剧的痛点正在被AI击破
长久以来译制剧出海具有两大痛点:低效率和高成本。当AI以新变量的姿态参与到译制剧的全流程时,问题得到了相当程度的解决。
据业内人士介绍,以往一集1到2分钟的短剧,需要先翻译台词,再去做配音、校对字幕时间轴等后期工作,100分钟的视频可能需要7到10天;涉及配音的译制剧工期相对更长,目前大约在15天左右。在这个较长的制作流程周期中,可能会出现被部分搬运内容的海外账号抢先发布或已经被多版权方投放了的情况。
因此,有些平台为了压缩周期,甚至会选择放弃译制,直接把中文版本放到海外宣传,这样做固然快,但有可能会影响受众面。
另一方面,尽管单部译制剧制作成本大多不到本土剧的1/20,但量大情况下的总成本也依然不便宜。一部单集2分钟、共100集的译制剧,成本在1.3万-7.3万元左右。而平台通常会一次性交给外包公司数十部、需要适配多个国家/语言的短剧,译制成本可能达到百万级。
因此,译制剧亟待进入批量化生产阶段,市场对技术方的需求迅速增长,AI技术对行业痛点的解决被寄予厚望。随着技术方深入行业及AI能力的快速迭代,译制剧出海的进程必然按下加速键,也赋予更多形式、题材的短剧更大的可能性。
就拿当前热门的动漫短剧来说,相比真人面孔出海还是有水土不服的可能,动漫角色几乎不需要担心这个问题。这也意味着,当国内动漫短剧供给量充足时,动漫短剧出海也就水到渠成。
值得正视的一点是,快手公布的最新数据显示,站内漫剧单日播放破峰70万;与此同时,短剧平台魔方负责人易总此前接受短剧自习室采访时透露,便宜的动漫短剧一分钟的成本可能需要三五万元,质量对标国漫的动漫短剧一分钟成本能去到十几万——内容增长和制作成本出现割裂的动漫短剧,是AI技术的另一个落地场景。
综合来看,对于想出海的短剧平台来说,译制剧依然是一个轻量化入口,AI扮演的是拓展入口、降低门槛的提效角色。基于目前国内每年产出上万部短剧,即便只对10%的内容做译制出海,也是可观的供给量。
2
技术加速落地,AI成为“多快好省”密码
不过,AI对一些人类能力的取代,有可能是在一夜之间发生的。某个业务看起来牢不可破的壁垒,有可能在新技术出现之后就突然崩塌。
在GPT-4o图像能力升级之后,一条流传很广的推文写道,这直接推翻之前很多公司的产品,他们花了那么多时间、人力、投资人的钱去调优的算法、工作流、模型,直接被一次大模型的更新就取代了。同样,长达七十余年发展史的配音译制行业,也正在经历这种“崩塌感”。
过去的语音模型在生成语音时,通常需要将文本分解成短句,然后逐句合成,再拼接起来。然而这种方法在处理长文本或需要多人对话的场景时,显得力不从心,难以保证语音的连贯性和自然度。
现在如ChatGPT、豆包等的语音模型都在尝试文本到语音的端到端合成,可以直接对原始的音频语料进行建模,生成更为自然的语音。
在海外,ElevenLabs开发的语音合成技术以其高质量和多样化的声音选择而著称,广泛应用于有声读物、播客和游戏等领域;也有进一步把工作流包装为一站式自动化流程的RaskAI等产品。但是这些技术在国内受到合规性和访问上的限制。
面对海外工具的局限性,国内企业积极研发适合本土需求的AI语音合成模型。2024年10月,香港中文大学(深圳)和科创独角兽公司趣丸科技联合推出了一个新的语音大模型“MaskGCT”。
MaskGCT在语音质量、相似度和可控性等方面做到了“全球SOTA”也就是行业最先进水平,一经推出便在海内外获得广泛关注。即使之前没有听过某个人的声音,MaskGCT能3秒“克隆”,音色、语调、风格与情感都能精确复刻。
4月7日,基于该模型的商业化产品“趣丸千音(All Voice Lab)”正式邀测,零门槛人人可用。拥有文本转语音、声音克隆、变声等多元能力,可进行多语种、多音色互换,同时支持字幕无痕擦除,还将上线对口型等功能。
在结合工作流和短剧行业经验的调优之下,“趣丸千音”的表现已经接近近期热炒的“智能体”(Agents)概念:只需一键上传视频,AI就会自主完成工作,直接交付自带外语字幕与配音的完整译制片。
同时,在有声书、播客、新闻播报等方面,工作流的自动化程度也同样强悍。目前支持中、英、日、韩、德、法多种语言互译,几十种音色可选,支持多角色分配和语速调节。
这个产品的另一个重要改进,是把字幕对时间轴也给做了。权衡之下,该工作室还是决定保留之前人工翻译的全流程业务,但是新增一个AI的产品选项,定价便宜一半。虽然趣丸千音实际上的成本节省远不止一半——甚至可能是纯人工的1/15;但是“现阶段还是得花时间在人工的复校上面。”她说,即使最终一个字都没有改,作为人工精校的业务,审核过程也不可以跳过。
译制剧出海需求的不断增长,“抢时间”的重要性再次凸显,以趣丸千音为代表的AI产品将进一步加剧短剧出海的竞争。牌桌上的玩家已经用上AI,或许也正是一种信号:短剧出海淘金已经离不开AI了。
来源:影视制作杂志