成为中国YouTube,这估计是每一家国内视频网站都曾经设想过的目标。
现在,无论是从全球市场规模、还是从营收规模上来说,YouTube都已经是一个庞然大物。而在国内,至今已难以找到一家能够与YouTube实力相当,甚至说模式相似的视频网站了。
差异是如何产生的,已经成为一个可以写成商业专著的选题了。而这一次我们则关心一个更为细节的产品技术问题,那就是在YouTube上早已实现的自动字幕功能,为何没有在国内的主流的视频网站上出现?
据报道,在年初,以UGC起家的YouTube已经为10亿条视频提供了自动添加字幕的服务,使用者每天的播放次数超过万次,而且目前已支持全球10种语言的自动字幕加载,以及支持包括简体中文在内的上百种语言的机器翻译。
那么这一自动字幕的功能为何没有被我们国内的视频网站“Copy”?
也许你第一反应会想到技术原因。也是也不全是。毕竟近几年,我国在自动语言识别上面的技术早已成熟,在视频网站上应用也许早已不成问题。
“是不为也,非不能也。”如果孟老夫子在世,可能还会说出这句话来。但原因究竟是啥,恐怕还是要继续追问下去,而最终我们其实还是想对这些国内视频网站的新老玩家们提问下:
这么“香”的技术,到底要不要学习一下呢?
自动字幕:从Goodness到Business
YouTube的自动字幕功能是在年由谷歌的工程师们开发的,那时离谷歌收购YouTube已经过去三年了。
这一功能的初衷是,通过将视频声音转化成文字字幕,为全世界有听力障碍的用户提供便利。而开发这一功能的软件工程师肯·海伦斯坦也正是一位聋哑人士。
众所周知,YouTube是从用户UGC视频内容起家的,目前仍然是全球最大的UGC视频网站。当前月用户访问数可以达到18亿,用户每分钟上传视频时长达到小时,并且时长还在增长。
这同时意味着,有大量上传的UGC视频中是没有主动添加字幕的。这对于正常听力的用户来说,并没有什么影响,而对于有听力障碍的人来说,则相当于缺少了极其重要的音频信息。
而自动字幕的加入,则在一定程度上帮助了听障用户获取更多的信息渠道。
目前,谷歌和YouTube团队正在利用机器学习为自动字幕增加音效信息,从而更大程度地丰富音频内容的表达。通过添加如铃声、狗叫声、敲门声等音效字幕,也正是出于改善聋哑或听障人士的观看体验而进行的技术改进。
这样一项出于社会责任感和用户公平体验的技术,也带来了额外的市场推广价值。
随着自动字幕可以识别的语种的增加,以及自动翻译功能的加入,这一项技术成为一项全球用户都可以受益的功能。比如,大量优质的英语原声知识分享视频可以通过自动添加英语字幕,再转为其他语种,供非英语区的用户观看学习。这显然对YouTube的全球化推广产生了积极的推动作用。
在每天上千万次的自动字幕的使用中,语音识别难免会出现一定错误,但随着YouTube社区用户对这些自动字幕信息进行评论和编辑后,这些信息又会再进入机器学习的流程,从而帮助自动字幕系统更好地提高准确率。同时,自动字幕及机器翻译准确度的提升,又推动内容推荐的精准度的提升,进一步增加用户粘性和使用时长。
一项帮助提升用户体验的AI技术,又在用户的海量数据的帮助下变得更加强大,很好地印证了“科技向善”可以带来更多意想不到的好处。
当然,这里有一点比较遗憾的地方是,如果你有机会使用YouTube的中文简体的自动翻译功能的时候,你可能并不好理解翻译出来的中文到底在表达什么意思?
一来,可能视频中中文口语化的音频内容确实不好翻译;二来,由于你懂得的原因,这个自动翻译的数据模型并没有得到有效的训练。
那么,自动字幕如此得天独厚的市场空白、如此巨大的应用规模,以及如此现成的技术条件,为什么没有国内的视频网站主动去使用呢?
为什么国内视频网站们“主动”错过这一技术?
想要回答几大国内视频网站“为啥没有采用自动字幕”这一小问题前,需要先回答“他们为啥没有继续发展UGC的内容模式,而是转向了影视剧版权购买的模式”?
十年多前的中国还不是一块UGC的沃土,相比较于美国家庭掀起的家庭录像及生活视频的制作消费的浪潮,当时的国人对于优秀影视作品的需求更为强烈。UGC内容并没有实现更好的商业变现方式,坚持以UGC为定位“土豆网”成了早早出局的元老级玩家。
而影视剧作品是不缺少优质的人工字幕翻译的。在国家严格把控版权问题之前,在这些视频网站上,大量的海外电视剧电影被以“用户上传”的名义免费播放。同时,提供国外影视剧翻译的字幕组的出现,也让视频网站们可以以极低的成本获得优质、准确的字幕。
年之后,随着爱奇艺、腾讯视频的出现,优酷土豆合并后又被阿里收购为标志的BAT巨头入场,视频网站们彻底进入了以PGC影视剧内容生态为主的“版权”烧钱争夺战。这时的巨头们已经开始向往Netflix的自制会员付费模式了。
UGC内容当中的字幕添加问题,从商业价值上也就再也没有进入这些网站的决策范围了。
再者,中国自身市场的数亿的用户红利,使得当时的视频网站们在争夺存量市场都有些自顾不暇,自然也没有动过“出海”的念头。没有出海需求,也就没有海外用户。而统一的中文语言环境并不需要对中文音频进行多语种的翻译。即使随着机器学习、自然语言处理技术的出现,也没有视频大厂们想要费力去应用。
对于长期处在烧钱亏损状态的玩家们,照顾听障者等弱势人群的观看体验,看来也没有进入到他们的产品目标当中。毕竟主流的影视剧视频资源和PCG内容资源都已经使用了人工添加的字幕。边缘化的UGC内容和特殊的少数用户群,似乎并不需要投入过多精力。
从以上种种的原因看来,动力不足,正是这些视频大厂们不愿玩转“自动字幕”的最好解释。而无所作为并不代表他们未来也不需要这项技术。
在当前人口红利消失、用户增加趋缓的情况下,出海成为近两年来几大视频网站玩家们的集体行动。除了将国内优秀的影视剧内容对外输出外,吸引海外用户制作分享大量的优质UGC内容,成为产品海外市场本地化发展的必由之路。
而从YouTube的启示来看,增加这一自动字幕以及自动语言翻译功能,将会对UGC内容生态带来非常积极的正面作用。
十年来,狂飙突进中落下的功课,是不是该补一补了?
破解出海困境,自动字幕可助一臂之力
当前,以海外版抖音TikTok为代表的短视频应用出海方兴未艾,而国内以腾讯、爱奇艺为代表的长视频网站巨头也已经开启出海模式。当前,主要扎堆进入东南亚市场。
TikTok这类更具兴趣属性和娱乐表演属性的短视频应用,沉浸式的算法推荐也同样在海外取得了极大的成功;带版权的背景音乐、炸裂特效和简单方便的字幕特效和傻瓜式的剪辑手法,使得海外年轻人们的接受和制作门槛更低。TikTok很快在日韩、美国以及东南亚等国家快速流行起来。
相比之下,依靠精品内容出海的视频网站则显得进展缓慢,需要步步为营,稳扎稳打。
我国视频网站的出海时间不长,但已经经历了三个阶段。先是经历了海外优质内容的引入;然后再复制这一模式加强自身版权内容的对外输出。而在去年,则开始主导搭建海外的自有媒体平台,并开始与海外各个国家的主流媒体、运营商等达成长期战略合作。
华语内容的输出成为本次出海的重点,但是想要在海外市场真正取得成功,那必然还是要吸引本地化的视频内容。据调查,海外视频用户更会为带有本地文化印记和本土语言的视频内容进行付费。因此,鼓励海外本地的UGC内容的制作和分享,培养和建成规模化和规范化的本地内容生态,才能最终留存住本地化用户,形成长期使用习惯。
除了进行一定的原创内容补贴,或者参照YouTube的广告分成模式外,降低UGC制作的使用门槛,提升海外用户的观影体验,也是更为根本的解决方案。
这时候,基于语音识别和机器翻译的能力,增加自动字幕以及自动翻译的功能,可以更好地帮助制作者完成字幕的添加工作,同时帮助大量用户快速翻译其他国家的视频内容。
一、通过加入对视频内容的自动字幕的加入,可以吸引海外用户更愿意主动创作本土内容,增进海外用户对本土内容的观看和消费。
二、通过引入多语种之间的字幕翻译,来提升和优化海外用户的内容推荐体系,从而形成丰富的海外生态,从而提高视频内容的国际化推广的力度。
当然,自动字幕和自动翻译功能的实现还受到语料资料的限制,国内的视频网站们除了自身所熟悉的中文视频外,还要对东南亚各国的音视频的语音进行大量地采集和训练。
出海难题无数条,起码这一技术可以作为在出海中打拼的“腾爱们”必须要补上的一门基础课,而视频内容的本地化UGC可以成为下一轮出海重点发力的新尝试。
欲戴王冠,必承其重。众所周知,YouTube在全球获得的巨大流量,来自于YouTube的强大的技术能力、广告营销体系以及谷歌的软硬件支持……从今天YouTube的成功去倒推原因,我们会列出一串长长的清单。在这份清单的一行里,我们注意到了出于社会责任而添加的一项小小的功能,而这一功能却带来每天上千万人的使用。
对于国内的视频网站来说,这确实是值得学习的一个经验。即使一开始并没有特别紧要的应用场景,也没有明显的商业利益,但是可以通过技术,特别是AI技术,来大规模地、以无限降低边际成本的方式,来改善用户体验,那一定是值得去尝试的。
而现在,国内视频网站、短视频已经处在扬帆出海的风口,语音识别以及机器翻译的技术也现成可用,而全球文化多元化交流的需求也正在井喷。出海的这些玩家们想要抓住这场新的全球UGC内容爆发的红利,自动字幕技术大有可为。