本文根据《智能平台白皮书》内容整理,以商汤SenseParrots平台为例。
5G+AI+XR 引发“视觉古登堡”媒介革命
科技(计算设备、通信网络)是媒介革命的起因。活字印刷和邮政网络,创造了以书报、纸刊为媒介的图文传播时代,广电网络和视听技术的共振,将大众娱乐带入了千家万户,客厅电视成为媒介中心,而随着移动通信网络的升级换代,以及从服务器、云计算到超算中心的计算变革,媒介形态不断更迭,从PC到手机,再到AIoT、 XR(扩展现实)。
媒介变革印证了麦克卢汉理论——“媒介是人类感官延伸的一切工具和技术”。随着技术的发展,人类感官体验不断被“数字化”,从早期印刷时代以文本数据为主,到广电视听阶段语音和平面视频数据的多元共生,再到移动互联网时代随着视频技术和带宽不断拓展,视频数据逐渐成为主流,据中国互联网络信息中心发布的《中国互联网络发展状况统计报告》显示,截至2020年3月,中国网络视频(含短视频)用户规模达8.5亿,视频数据占全网数据已超过一半(2018年统计)。随着5G带宽进一步提升,媒介终端进一步向IoT、XR拓展,以及光电传感器、3D摄像头设备的广泛普及,愈来愈多的终端将会具备“智能视力”,视频数据将会迎来下一轮爆发性增长,且呈现多模态、全景化发展。思科预测2022年底有79%的移动数据流量来自视频,而英特尔预测2028年90%的互联网流量是视频,人均视频需求将增长7倍。因此我们判断,未来二十年,人类社会将加速步入“视觉互联网”时代。正如古登堡印刷技术下的图文传播推动了西方契约型社会的形成,5G背景下,“视觉物联网”也将开启新商业“古登堡”革命。
智慧视觉平台:“视觉互联网”新商业基础设施
商汤赋予企业端到端的AI能力
SenseParrots平台典型案例剖析
案例:广电“短视频”解决方案(L1级)
?客户痛点
在传媒领域,由于节目内容的快速迭代,标签及需要识别的对象也日趋复杂、种类繁多,包括舞蹈、动作、logo、明星等,SenseMedia需要对新标签做出快速响应、老标签进行及时更新,以满足视频搜索和制作的高精准度需求。这背后需要依托强大的计算平台作为载体,通过对海量的视频原始数据的处理、标注、模型的训练、部署到应用的全流程支撑,满足标签识别等算法模型的快速产出、迭代,最终在应用端实现高精准度要求。
图 SenseMedia多层次、多维度视频内容的标签体系
案例:中东某国资背景企业移动车载智能执法解决方案(L2级)
中东某国资背景企业的业务之一即是协助沙特内政部履行交通违章执法。沙特传统违章执法主要依据固定摄像头抓拍,但由于固定执法缺乏机动性,在没有摄像头覆盖的地区,违规现象十分普遍,即便增加机动性相对较高的手持摄像头,也只能做到数天更换位置,司机很容易互通有无,主动规避执法。为解决执法覆盖率和机动性双重问题,提升执法效率和国民交通安全意识,该客户与商汤合作定制开发车载移动摄像头的违章执法方案,适配各种天气对违章数据收集处理,能够对11种违章行为进行精准智能检测识别。
在实际执法中,车载摄像头采集的图像数据通过4G网络或离线下载传输至推理平台,并与第三方数据源(例如车辆保险信息、车检信息等)打通,对11项违规行为进行比对、识别和判断,将违章结果通过API形式输出执法界面。
案例:某知名车企自动驾驶解决方案(L3级)
案例:某自动驾驶公司超算平台解决方案(L4级)
主编|吴坤 商汤智能产业研究院 学术委员会秘书长
编辑|刘欣 商汤智能产业研究院 助理研究员
商汤智能产业研究院是依托商汤科技海量数据和深度学习的人工智能技术、深耕AI产业化落地案例、集结全球AI产业前沿专家学者,以开放、合作、共建、共享方式打造的具有影响力的AI产业研究的知识平台,致力于打造中国AI产业第一智库。
合作共赢:携手开启AI新大陆的探索之旅
文章转载自微信公众号商汤智能产业研究院