管理培训搜索
18318889481 13681114876

行业
| 关于图像识别技术在视频通信领域的发展应用现状的报告当前您所在的位置:首页 > 行业 > 电信、媒体和技术(TMT) > IT与通信

摘要:在现代信息技术不断发展的背景下,图像识别技术在我国得到了较大的发展和广泛的应用,同时视频通信业务范围也日益扩大。本文主要就图像识别技术的发展及其在视频通信领域的应用现状进行了探析,以期能够更好地提升图像识别技术的应用价值。

关键词:图像识别技术,视频通信,发展应用现

一、引言

图像识别技术是以图像为基础,利用计算机对图像进行处理后,将其中的目标对象识别出来并加以分析的技术。随着20世纪60年代以来计算机技术与信息技术的发展,图像识别技术越来越被人类所发掘和研究,图像识别技术已经应用到人们的日常生活方方面面中。应用范围包括医学、航空航天、农业生产、工业工程、通信、交通、军事安防等多个领域,如医疗诊断中各种医学图片的分析与识别、天气预报中卫星云图识别、遥感图像识别、指纹识别、脸谱识别、智能机器人、电子警察系统等,其中最典型的应用是在通信工程和生物医学中的应用。

随着社会的发展和通信技术的进步,人们对通信的需求发生了巨大的变化,由最初单一的文字或语音通信提升为对视频和音频多方面的通信需求,通信领域的发展热点也逐步转向以传送语音、图像、数据和视频为一体的视频通信业务。不仅如此,在视频监控、电视会议、远程医疗和远程视频教育等方面,视频通信也成了不可替代的一项技术。

随着电子技术和互联网的快速发展,视频通信中对信息准确性及图像清晰度要求的提高成为可能。与之相对应的是,如今的图像识别技术更加先进,更加精准,能用纳秒级的时间处理和加工非常复杂的图像。因此,图像识别技术在视频通信领域的发展与应用是非常值得关注的。

二、计算机图像识别技术的发展

计算机图像识别技术模仿人类对于图像的识别过程,通过分类并提取图像的重要特征且排除多余的信息,然后对识别出来的信息进行整合,最终将分阶段识别出来的信息形成一个完整知觉映像,从而判断出识别目标。简单来说,识别过程包括图像预处理、图像分割、特征提取和判断分类匹配,如1所示。

从计算机图像识别技术的发展阶段来看,早20世纪20年代,这项技术就已经开始在西方多国出现并且得到初步应用。50年代,计算机图像识别技术还停留在数字、文字处理方面。60年代,随着计算机性能大幅度提升,计算机图像识别与处理技术发展势头迅猛,比60年代出现的CT扫描进行疾病诊断,70年代末被授予诺贝尔奖。到了90年代,图像识别与处理技术真正进入到大规模发展阶段,真正飞跃发展是21世纪。

进入到21世纪,智能化时代已悄然来临,人们的生活方式也得到了极大的改变,我们在通信的过程中也可以传输图像、声音、文字等信息。网络能够承载电视、电话以及综合类型的数字通信,满足人们的各种日常生活工作需求。移动互联网、智能手机以及社交网络的发展,使人们的生活充满了海量的图片信息,图片与视频成为通信交流的又一大主要媒介。在此环境下,计算机图像识别处理技术显得尤为重要。

三、图像识别技术

图像识别主要有模式识别和神经网络两种技术。

(一)模式识别

模式识别是指对表征事物或现象的各种形式的图像信息进行处理和分析,通过计算机用数学技术方法来研究模式的自动处理和判读、识别图像所具备的多种特征。简单来说,模式识别就是利用计算机对图像的特征提取后进行分类,在错误概率最小的条件下,使识别的结果尽量与目标对象相符合。模式识别可用于文字和语音识别、遥感和医学诊断等方面,但在当前的实际操作过程中,计算机图像识别模式和人类大脑图像识别图形图像的模式还存在着一定差异,在处理的过程中难免会出现一些错误信息。

(二)神经网络

神经网络具体来说,就是模仿动物神经网络行为特征,进行分布式并行信息处理的数学模型。这种网络基于系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。相比之前的模式识别,该方法取得了很大成功。当前在图像识别领域广泛应用的主要有多层神经网络和卷积神经网络技术。

1.多层神经网络

多层神经网络由输入层、隐藏层、输出层三个部分组成,其中隐藏层也被称为中间层(可以从几层到数百层)。每层都由多个神经元组成,层与层之间相互连接,每一个连接均有一个权重值与之相对应。在多层神经网络中,每一个像素点都需要有一个神经元与之对应。显而易见,这种方法费时费力,例如识别一1000帧每帧1000像素*1000像素组成的视频,输入层将10^9个神经元组成,导致计算成本过大,显然此方法并不存在实际的应用价值。

2.卷积神经网络

为解决多层神经网络所需样本多和计算量大的问题,在中间层引入卷积层和池化层,将其称之为卷积神经网络。卷积神经网络根据神经元间的相似性进行筛选与过滤,使得图像计算大幅度简化。对于某个给定层,输入和神经元之间并不是一一对应的关系,而是专门限制了连接,这样任意神经元只能接受来自前一层的一小部分的输入3×3或5×5。因此,每个神经元只需要负责处理其中某一个特定部分,这样所需样本数量及运算资源显著降低。

四、计算机图像识别技术在视频通信领域的应用现状

迈入新时代后,社会文明和科技水平的发展日新月异,视频通信应用越来越广泛,成为众多行业不可或缺的一环。现如今,在通信工程领域中,主要的研究方向是声音、文字、图像和视频之间的结合,即所谓的现代流媒体通信,而其中最复杂的当属数字图像通信,主要原因在于图像传输时对于数据带宽的需求非常庞大。举个例子,目前智能电视机传输带宽必须达100  M/s以上。因此,在对于图像信号进行输送的过程当中,必须使用编码技术压缩信息量。

就目前而言,图像识别技术在流媒体通信领域发展是非常显著的,并且也取得了一定的成果。

(一)视频通信即服务

在现阶段发展中随着宽带网络建设快速增长,移动互联网有了明显的变化,移动通信、社交媒体以及视频通信等通信技术已经展现出了全新的发展趋势。视频图像通信主要包括两个过程,一是摄录本地会场的视频图像、语音和数据信息并进行压缩编码处理,处理为适合信道传输的信号后发送出去;二是将接收到的各种信号进行滤波和译码等操作,把原始的基带信号再现出来。目前视频通信运营涉及以下两个模式:第一,视频会议电视,这是一种集图像、语音为一体的常见的视频通信业务,它利用互联网,通过会议电视终端把相隔异地的会议室连接起来,使出席会议的人可以进行相当于面对面的交谈。第二,基于互联网基础上的会议云服务,例如腾讯会议、ZOOM等软件能够同时支持多个人多路视频图像,具有浏览批注、共享电子文档等功能。

(二)视频监控

当前视频监控系统遍布在我们生活和工作环境中各个角落。在安防设备布置过程中,智能化计算机图像识别技术的应用有两个好处。一是可以不再派人长时间驻守在监控前,有效降低人工成本。二是降低由主观判断所造成的疏漏,有效提升视频监控的准确性,并且计算机对视频监控的处理更加高效。视频监控图像的自动化、智能化处理,使得视频信息可以成为事故鉴定的有效且主要依据。监控技术、运动检测和图像识别技术互相融合发展,无人自动智能监控系统由此诞生,被广泛应用于电力、交通、智能防火等领域。

(三)远程视频医疗

远程医疗、在线诊疗的普及,使得医生可以通过视频通话、互动平台与患者交流病情,医生们相互之间也可以通过上述方法交流,共同对疾病及时做出综合医疗决策。通过医疗设备拍片查看,比如常见X射线、CT技术、超声波、心电图、显微图像、染色体辨别、癌细胞辨别等一些医疗诊断技术,都利用了图像识别技术。这些显示图像可为医生提供行之有效的诊断依据,进而对疾病进行针对性的治疗手段。但是限制于目前的技术水平和音视频质量,尚未满足远程医疗对于实时性和高画质的要求。

(四)远程视频教育

远程视频教育是一种新兴的教育模式。网络开放课程打破了传统课堂时间和空间的限制,更多的学习者能够共享优秀的教育资源。然而,目前开放课程仍然存在诸多问题,比如:师生之间不能实时互动交流、缺乏行之有效的学习效果跟踪手段等,这些因素都影响到了开放课程更大规模的应用,造成了许多优质教育资源的闲置与浪费。目前,利用实时互动、数字视频通信、多媒体智能图像识别检索等关键技术,构建云计算环境下的大规模实时互动学习平台是支持学习者随时随地、使用各种终端进行大规模在线点播互动学习的重要方式,使得开放课程的应用从单纯的资源供给一方向课程与教学的转变。

(五)基于内容的视频信息检索

传统的视频信息检索采用基于关键词的检索方式,即通过对每一个视频文件进行标注,然后仅需文本信息的检索就可以完成对视频内容的检索。由于标注描述有限、手工标注速度以及主观性强等等问题,当前方法已经远远不能达到成千上万的视频检索的要求,因此基于视频和图像内容信息的检索技术应运而生。该技术的原理是先令机器储存大量的图像或视频,建立图像数据库。随后对需要检索的视频进行检索包含目标物体的图像(或视频片段),从而对该视频内容自动进行归纳。

算法的核心技术是通过自动图像识别或理解图像重要特征的方法对视频进行整合与归类,从而实现按图像内容从视频库中检索图像文件。底层视觉特征和高层语义特征的提取是图像检索技术在发展中遇到的两大难题,从而导致目前还未大规模应用。

五、结束语

随着人们对视频通信服务的需求量与日俱增,人们对通信业务的服务质量要求也越来越高。由于当前网络宽带建设尚存不足,编码也存在优化的空间,视频会议、视频监控和远程视频教育等的服务尚存在诸多值得改进的部分。因此目前相关人员需要着力解决视频图像技术亟待解决的问题,提升视频图像处理整体质量,以满足大众多样化、高质量通信服务需求。

参考文献:

[1]刘海洋.计算机智能化图像识别技术的探讨[J].中国新通信,2021,2313:127-128.

[2]李亚奇.计算机图像识别技术的发展现状与应用实践[J].信息与电脑(理论版)201914:30-31+34.

[3]马晨.图像识别的技术现状和发展趋势探析[J].中国新通信,2017,1909:39.

[4]向晓华.计算机智能化图像识别技术的探讨[J].科技创新导报,2020,1713:141-142.

[5]黄春.计算机图像识别技术的现状及改进建议[J].电子技术与软件工程201916:73-74.

[6]刘显龙.视频通信技术发展趋势探讨[J].电视技术,2019,4313:78-80.

[7]张晓娟,高瑾.计算机图像识别技术的应用及细节问题阐述与分析[J].电子技术与软件工程201606:89.

[8]张家怡.图像识别的技术现状和发展趋势[J].电脑知识与技术,2010,621:6045-6046.

[9]马晨.基于视频流的图像识别技术发展与应用[J].电子技术与软件工程201706:78.

[10]叶晨.医学图像数字处理及识别技术研究[D].电子科技大学,2012.

[11]杨东.5G+人工智能机器视觉探索[J].通信与信息技术,202101:60-63.

[12]陈环宇,高莺,李晓珂,余永华,周宇.基于图像识别的在线视频教育平台[J].科技创新与生产力,201812:24-25+31.

[13]徐苑苑.云计算环境下的开放课程应用研究[D].华东师范大学,2013.


 


作者: 山东科技大学 高俊杰  来源: 《中国新通信》2022年第7期


TESG
企业概况
联系我们
专家顾问
企业文化
党风建设
核心团队
资质荣誉
合规监管
部门职责
转创中国
加入转创
经济合作
智库专家
质量保证
咨询流程
联系我们
咨询
IPO咨询
投融资咨询
会计服务
绩效管理
审计和风险控制
竞争战略
审计与鉴证、估价
企业管理咨询
人力资源战略与规划
融资与并购财务顾问服务
投资银行
企业文化建设
财务交易咨询
资本市场及会计咨询服务
创业与私营企业服务
公司治理、合规与反舞弊
国企改革
价值办公室
集团管控
家族企业管理
服务
数据分析
资信评估
投资咨询
风险及控制服务
管理咨询
转型升级服务
可行性研究咨询服务
民企与私人客户服务
解决方案
内控
税收内部控制
税收风险管理
内控管理师
内部控制咨询
信用研究
信用法制中心
风险与内控咨询
无形资产内控
企业内控审计
内部控制服务
内部控制评价
内部控制体系建设
内部控制智库
上市公司内控
上市公司独立董事
投行
M&A
资本市场
SPAC
科创板
金融信息库
IPO咨询
北交所
ASX
SGX
HKEX
金融服务咨询
信用评级
上海证券交易所
NYSE
深圳证券交易所
审计
审计资料下载
法证会计
审计事务
审计及鉴证服务
审计咨询
反舞弊中心
内部控制审计
内部审计咨询
国际审计
合规
银行合规专题
合规管理建设年
海关与全球贸易合规
数据合规专题
反腐败中心
反垄断合规
反舞弊中心
国际制裁
企业合规中心
信用合规专题
证券合规专题
合规中心
金融合规服务
反洗钱中心
全球金融犯罪评论
行业
新基建
文化、体育和娱乐业
电信、媒体和技术(TMT)
投城交通事业部
房地产建筑工程
医疗卫生和社会服务
可持续发展与环保
全球基础材料
大消费事业部
金融服务业
化学工程与工业
一带一路
智慧生活与消费物联
数字经济发展与检测
食品开发与营养
先进制造事业部
能源资源与电力
消费与工业产品
运输与物流
酒店旅游餐饮
科学研究与技术服务
政府及公共事务
化妆品与个人护理
一二三产融合
生物医药与大健康
新能源汽车与安全产业
法律
法律信息库
税法与涉税服务
数字法治与网络安全
劳动与人力资源法律
金融与资本市场法律
司法研究所
公司法专题
私募股权与投资基金
债务重组与清算/破产
转创国际法律事务所
转创法信事务所
财税
法务会计
管理会计案例
决策的财务支持
家族资产和财富传承
财税法案例库
资产评估
财税信息库
会计准则
财务研究所
财政税收
会计研究所
财税实务
投资咨询
财务管理咨询
审计事务
管理
转创智库
金融研究所
企业管理研究所
中国企业国际化发展
经济与产业研究
公司治理
气候变化与可持续
ESG中心
管理咨询
转创
咨询业数据库
转创网校
生物医药信息库
建筑工程库
转创首都
转创教育
转创国际广东 官网
科研创服
中国转创杂志社
创新创业
转型升级
技术转移中心
转创中国
中外
粤港澳大湾区
中国-东盟
一带一路
澳大利亚
俄罗斯
新加坡
英国
加拿大
新西兰
香港
美国
中非平台
开曼群岛
法国
欧洲联盟
印度
北美洲
18318889481 13681114876
在线QQ
在线留言
返回首页
返回顶部
留言板
发送