-->
为11月的流媒体连接保存您的免费座位. 现在注册!

人工智能将很快给直播视频制作带来巨大变化

文章特色图片

人工智能(AI), 深度学习, 自然语言处理将是流媒体的下一个变革技术. 它们都将在制作的各个阶段对流媒体产生影响, 从内容创作到消费. 随着人工智能在许多不同行业的扩散, 毫无疑问,在不久的将来,它将在更大范围内被大量用于直播.

在这一领域取得进展的一些公司和技术包括 谷歌云视频智能, Conviva的视频AI架构, 英伟达国防后勤局, IBM ' s的华生 技术. 目前,所有这些技术都在不同程度上部署了人工智能,尤其是在云计算领域,但我们很快就会看到人工智能进入流媒体的其他方面.

人工智能可以帮助取代幕后的生产人员,甚至可以执行涉及劳动密集型内容/数据管理的平凡而耗时的任务. 目前, 人工智能被用于观众指标, 网络和技术故障排除, 广告服务, 但还有其他潜在的用途几乎尚未开发.

智能相机跟踪和视频帧组成

虽然目前有几个运动跟踪相机系统允许自动跟踪移动的对象在相机前面, 它们都需要生产者在物体上放置发射器或传感器. 人工智能将能够追踪扬声器, 运动员, 或娱乐,而不需要任何类型的额外硬件或传感器. 深度学习算法将分析视频并跟踪人们进行不同的活动, 无论是在舞台上还是在其他环境中, 同时在相机内保持完美的构图. 即使是现在, 这项技术使无人机能够跟踪在赛场上冲刺的运动员,并以毫不留情的精度跟踪目标.

此外,创造性视觉叙事与数学之间存在直接关联. 视频成像的关键组成部分——帧率, 焦距, 孔径, 而构图——则是基于比率,并且至少需要对其背后的数学有基本的了解才能有效地使用它们.

黄金分割(比例, 被艺术家们奉为千年珍宝, 架构师, 科学家也一样, 其中两个数的比率等于它们的和与两个量中较大的数的比率)可以编程到基于深度学习的视觉感知算法中. 因此, 人工智能摄像头可以进行优化,以捕捉人眼最美观的视频图像, 传统上由摄像师完成的任务. 在大多数情况下,人工智能最终将取代对摄像师的需求. 除了, 人工智能将被编程为以黄金比例和视觉层次原则为基础来跟踪对象.

实时视频切换

深度学习算法正在使编辑和视频制作过程自动化, 并将帮助将人工智能引入实时视频切换. 智能软件会根据流媒体的内容,通过面部识别来选择最佳的镜头或角度, 情感, 手势, 服装, body, 颜色识别, 以及其他成像数据和线索. 程序将确定流的每一帧中有什么内容,并确定它是否是宽的, 媒介, 或者特写角度, 以及选择它的主题或人物. 软件会分析音频, video, 和其他方面的流和切换一个完整的事件或显示通过识别面孔, 演讲, 运动, 或者基于许多其他因素的事件.

这些自动混合功能将包括在未来的视频切换,以允许一个完全的人工智能切换生产. 它最终将取代现场活动技术总监的角色.

基于计算机视觉的视频切换器可以在嵌入式系统或使用现有硬件的本地设备上独立工作. 如果需要,摄像头甚至可以利用联网的云服务器.

为实时图形、动画或CG角色创建自动动作和触发器

神经网络可以通过面部识别来识别目标物体或人, 哪些可以触发生产事件,例如在会议上为演示者生成较低的三分之一. 面部识别还可以生成球场上特定球员的图形统计数据, 甚至允许将CG角色的控制插入流中.

认知技术将在所有领域盛行——体育运动, 的电子竞技, 企业沟通, 教育, 现场活动. 这将集成数据驱动的资产和根据特定操作变化的可视化, 次, 位置, 或者与流相关的动态数据.

音频分析

自然语言处理(NLP)允许自动现场转录, 翻译, 解释, 字幕, 以及用于会议的音频描述, 讲座, 或事件. 这对于需要为市政厅提供实时字幕的跨国公司非常有用, 产品发布, 或以多种语言为全球受众提供一般通信.

用于数据管理的视频分析和元数据提取

随着公司越来越多地涉足流媒体, 视频产生的数据量正呈指数级增长. 从这些数据中获得的信息可以被利用,而不仅仅是人工提取的信息.

人工智能将通过生成描述性标签来解释流内容并提取元数据, 类别, 自动总结. 这将允许更智能的分析, 内容的见解, 更好的内容管理, 为通过定向广告实现视频货币化的有效方法铺平道路.

监测社交媒体情绪和汽车分享

社交媒体监控允许品牌衡量在线对话和情绪分析, 实时跟踪用户反应. 这允许对内容进行即时定制或调整,以适应观众所陈述的偏好. 自然语言算法将从流中提取数据并捕获主要主题和关键字, 然后编译截图, 视频脚本, 并突出可用于营销目的或自动上传到社交媒体的片段.

一旦能够充分释放人工智能的潜力,人工智能将成为流媒体行业公司利用的强大工具. 我们刚刚开始触及人工智能在智能流媒体方面的全部力量. 上面的例子只是人工智能如何通过使直播内容更吸引人、更高效来增强直播的一个小例子, 同时从生产到交付都可以节省成本. 人工智能将推动内容所有者, 媒体生产商, 广告客户也进入了一种新的创造性思维,即制作聪明而引人注目的内容.

[本文发表于2017年10月号。 流媒体杂志 “为自主流媒体做好准备。."]

流媒体覆盖
免费的
合资格订户
现在就订阅 最新一期 过去的问题
相关文章

什么是人工智能CEO? 问问Mobeon的马克Alamares,他刚刚雇了一个

Mobeon的马克Alamares, 流媒体和虚拟制作行业最具创新性的媒体公司之一, 将辞去首席执行官一职,将公司的运营和战略规划大权交给中国太空飞船Tron, 他可能是流媒体行业首位人工智能CEO. 这是流媒体编辑史蒂夫·内森斯-凯利的采访, 马克(他将继续担任Mobeon的首席运营官)解释了拥有一位人工智能首席执行官的全部含义, 以及为什么他相信其他媒体公司会看到战略和运营上的好处,并在未来几年跟随Mobeon走这条路.

人工智能和机器学习将视频质量推向新的高度

人工智能和机器学习, 还有深度学习和神经网络, 正在解决从编码质量到封闭字幕的OTT挑战.

网络研讨会:利用人工智能来释放视频的潜力

人工智能、机器学习和神经网络不再是明天的科幻梦想. 他们今天就在这里,IBM沃森在这方面处于领先地位. 在12月14日星期四的网络研讨会上了解更多关于它是如何工作的.AI

SMW 17:今天和明天的直播

峰会小组成员一致认为:直播, 用户生成的内容将继续与专业制作的内容竞争——甚至可能超越, 我们需要开发工具和技术来跟上发展的步伐

招聘、教育、医疗领先的实时视频采用

实时视频可以帮助公司节省差旅成本,并使患者获得更好的医疗服务. 以下是直播视频最成功的三个领域.

在Conviva的帮助下,HBO使用AI来对抗缓冲

Conviva表示,只有通过智能实时检测才能实现高质量的互联网流, HBO正在使用Conviva的新视频人工智能平台,通过HBO GO和HBO NOW实现这一目标

中视电视宣布推出人工智能驱动的可定制付费电视频道服务

在微软和Ooyala的帮助下, ZoneTV正在创建一个系统,为付费电视用户提供在线视频流,并根据他们的偏好进行学习.

微软在Build大会上首次推出视频AI云服务

人工智能提供了一种简单快速的方法来从视频库中获取各种元数据. 有了微软的认知服务,开发者可以免费试用.