关于图像识别技术在视频通信领域的发展应用现状的报告

摘要：在现代信息技术不断发展的背景下，图像识别技术在我国得到了较大的发展和广泛的应用，同时视频通信业务范围也日益扩大。本文主要就图像识别技术的发展及其在视频通信领域的应用现状进行了探析，以期能够更好地提升图像识别技术的应用价值。

关键词：图像识别技术，视频通信，发展应用现状

一、引言

图像识别技术是以图像为基础，利用计算机对图像进行处理后，将其中的目标对象识别出来并加以分析的技术。随着20世纪60年代以来计算机技术与信息技术的发展，图像识别技术越来越被人类所发掘和研究，图像识别技术已经应用到人们的日常生活方方面面中。应用范围包括医学、航空航天、农业生产、工业工程、通信、交通、军事安防等多个领域，如医疗诊断中各种医学图片的分析与识别、天气预报中卫星云图识别、遥感图像识别、指纹识别、脸谱识别、智能机器人、电子警察系统等，其中最典型的应用是在通信工程和生物医学中的应用。

随着社会的发展和通信技术的进步，人们对通信的需求发生了巨大的变化，由最初单一的文字或语音通信提升为对视频和音频多方面的通信需求，通信领域的发展热点也逐步转向以传送语音、图像、数据和视频为一体的视频通信业务。不仅如此，在视频监控、电视会议、远程医疗和远程视频教育等方面，视频通信也成了不可替代的一项技术。

随着电子技术和互联网的快速发展，视频通信中对信息准确性及图像清晰度要求的提高成为可能。与之相对应的是，如今的图像识别技术更加先进，更加精准，能用纳秒级的时间处理和加工非常复杂的图像。因此，图像识别技术在视频通信领域的发展与应用是非常值得关注的。

二、计算机图像识别技术的发展

计算机图像识别技术模仿人类对于图像的识别过程，通过分类并提取图像的重要特征且排除多余的信息，然后对识别出来的信息进行整合，最终将分阶段识别出来的信息形成一个完整知觉映像，从而判断出识别目标。简单来说，识别过程包括图像预处理、图像分割、特征提取和判断分类匹配，如图1所示。

从计算机图像识别技术的发展阶段来看，早在20世纪20年代，这项技术就已经开始在西方多国出现并且得到初步应用。50年代，计算机图像识别技术还停留在数字、文字处理方面。60年代，随着计算机性能大幅度提升，计算机图像识别与处理技术发展势头迅猛，比如60年代出现的CT扫描进行疾病诊断，在70年代末被授予诺贝尔奖。到了90年代，图像识别与处理技术真正进入到大规模发展阶段，真正飞跃发展是在21世纪。

进入到21世纪，智能化时代已悄然来临，人们的生活方式也得到了极大的改变，我们在通信的过程中也可以传输图像、声音、文字等信息。网络能够承载电视、电话以及综合类型的数字通信，满足人们的各种日常生活工作需求。移动互联网、智能手机以及社交网络的发展，使人们的生活充满了海量的图片信息，图片与视频成为通信交流的又一大主要媒介。在此环境下，计算机图像识别处理技术显得尤为重要。

三、图像识别技术

图像识别主要有模式识别和神经网络两种技术。

（一）模式识别

模式识别是指对表征事物或现象的各种形式的图像信息进行处理和分析，通过计算机用数学技术方法来研究模式的自动处理和判读、识别图像所具备的多种特征。简单来说，模式识别就是利用计算机对图像的特征提取后进行分类，在错误概率最小的条件下，使识别的结果尽量与目标对象相符合。模式识别可用于文字和语音识别、遥感和医学诊断等方面，但在当前的实际操作过程中，计算机图像识别模式和人类大脑图像识别图形图像的模式还存在着一定差异，在处理的过程中难免会出现一些错误信息。

（二）神经网络

神经网络具体来说，就是模仿动物神经网络行为特征，进行分布式并行信息处理的数学模型。这种网络基于系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。相比之前的模式识别，该方法取得了很大成功。当前在图像识别领域广泛应用的主要有多层神经网络和卷积神经网络技术。

1.多层神经网络

多层神经网络由输入层、隐藏层、输出层三个部分组成，其中隐藏层也被称为中间层（可以从几层到数百层）。每层都由多个神经元组成，层与层之间相互连接，每一个连接均有一个权重值与之相对应。在多层神经网络中，每一个像素点都需要有一个神经元与之对应。显而易见，这种方法费时费力，例如识别一段1000帧每帧1000像素*1000像素组成的视频，输入层将由10^9个神经元组成，导致计算成本过大，显然此方法并不存在实际的应用价值。

2.卷积神经网络

为解决多层神经网络所需样本多和计算量大的问题，在中间层引入卷积层和池化层，将其称之为卷积神经网络。卷积神经网络根据神经元间的相似性进行筛选与过滤，使得图像计算大幅度简化。对于某个给定层，输入和神经元之间并不是一一对应的关系，而是专门限制了连接，这样任意神经元只能接受来自前一层的一小部分的输入（例如3×3或5×5）。因此，每个神经元只需要负责处理其中某一个特定部分，这样所需样本数量及运算资源显著降低。

四、计算机图像识别技术在视频通信领域的应用现状

迈入新时代后，社会文明和科技水平的发展日新月异，视频通信应用越来越广泛，成为众多行业不可或缺的一环。现如今，在通信工程领域中，主要的研究方向是声音、文字、图像和视频之间的结合，即所谓的现代流媒体通信，而其中最复杂的当属数字图像通信，主要原因在于图像传输时对于数据带宽的需求非常庞大。举个例子，目前智能电视机传输带宽必须达到100 M/s以上。因此，在对于图像信号进行输送的过程当中，必须使用编码技术压缩信息量。

就目前而言，图像识别技术在流媒体通信领域发展是非常显著的，并且也取得了一定的成果。

（一）视频通信即服务

在现阶段发展中随着宽带网络建设快速增长，移动互联网有了明显的变化，移动通信、社交媒体以及视频通信等通信技术已经展现出了全新的发展趋势。视频图像通信主要包括两个过程，一是摄录本地会场的视频图像、语音和数据信息并进行压缩编码处理，处理为适合信道传输的信号后发送出去；二是将接收到的各种信号进行滤波和译码等操作，把原始的基带信号再现出来。目前视频通信运营涉及以下两个模式：第一，视频会议电视，这是一种集图像、语音为一体的常见的视频通信业务，它利用互联网，通过会议电视终端把相隔异地的会议室连接起来，使出席会议的人可以进行相当于面对面的交谈。第二，基于互联网基础上的会议云服务，例如腾讯会议、ZOOM等软件能够同时支持多个人多路视频图像，具有浏览批注、共享电子文档等功能。

（二）视频监控

当前视频监控系统遍布在我们生活和工作环境中各个角落。在安防设备布置过程中，智能化计算机图像识别技术的应用有两个好处。一是可以不再派人长时间驻守在监控前，有效降低人工成本。二是降低由主观判断所造成的疏漏，有效提升视频监控的准确性，并且计算机对视频监控的处理更加高效。视频监控图像的自动化、智能化处理，使得视频信息可以成为事故鉴定的有效且主要依据。监控技术、运动检测和图像识别技术互相结融合发展，无人自动智能监控系统由此诞生，被广泛应用于电力、交通、智能防火等领域。

（三）远程视频医疗

远程医疗、在线诊疗的普及，使得医生可以通过视频通话、互动平台与患者交流病情，医生们相互之间也可以通过上述方法交流，共同对疾病及时做出综合医疗决策。通过医疗设备拍片查看，比如常见的X射线、CT技术、超声波、心电图、显微图像、染色体辨别、癌细胞辨别等一些医疗诊断技术，都利用了图像识别技术。这些显示图像可为医生提供行之有效的诊断依据，进而对疾病进行针对性的治疗手段。但是限制于目前的技术水平和音视频质量，尚未满足远程医疗对于实时性和高画质的要求。

（四）远程视频教育

远程视频教育是一种新兴的教育模式。网络开放课程打破了传统课堂时间和空间的限制，更多的学习者能够共享优秀的教育资源。然而，目前开放课程仍然存在诸多问题，比如：师生之间不能实时互动交流、缺乏行之有效的学习效果跟踪手段等，这些因素都影响到了开放课程更大规模的应用，造成了许多优质教育资源的闲置与浪费。目前，利用实时互动、数字视频通信、多媒体智能图像识别检索等关键技术，构建云计算环境下的大规模实时互动学习平台是支持学习者随时随地、使用各种终端进行大规模在线点播互动学习的重要方式，使得开放课程的应用从单纯的资源供给一方向课程与教学的转变。

（五）基于内容的视频信息检索

传统的视频信息检索采用基于关键词的检索方式，即通过对每一个视频文件进行标注，然后仅需文本信息的检索就可以完成对视频内容的检索。由于标注描述有限、手工标注速度以及主观性强等等问题，当前方法已经远远不能达到成千上万的视频检索的要求，因此基于视频和图像内容信息的检索技术应运而生。该技术的原理是先令机器储存大量的图像或视频，建立图像数据库。随后对需要检索的视频进行检索包含目标物体的图像（或视频片段），从而对该视频内容自动进行归纳。

算法的核心技术是通过自动图像识别或理解图像重要特征的方法对视频进行整合与归类，从而实现按图像内容从视频库中检索图像文件。底层视觉特征和高层语义特征的提取是图像检索技术在发展中遇到的两大难题，从而导致目前还未大规模应用。

五、结束语

随着人们对视频通信服务的需求量与日俱增，人们对通信业务的服务质量要求也越来越高。由于当前网络宽带建设尚存不足，编码也存在优化的空间，视频会议、视频监控和远程视频教育等的服务尚存在诸多值得改进的部分。因此目前相关人员需要着力解决视频图像技术亟待解决的问题，提升视频图像处理整体质量，以满足大众多样化、高质量通信服务需求。

参考文献：

[1]刘海洋.计算机智能化图像识别技术的探讨[J].中国新通信，2021，23（13）：127-128.

[2]李亚奇.计算机图像识别技术的发展现状与应用实践[J].信息与电脑（理论版），2019（14）：30-31+34.

[3]马晨.图像识别的技术现状和发展趋势探析[J].中国新通信，2017，19（09）：39.

[4]向晓华.计算机智能化图像识别技术的探讨[J].科技创新导报，2020，17（13）：141-142.

[5]黄春.计算机图像识别技术的现状及改进建议[J].电子技术与软件工程，2019（16）：73-74.

[6]刘显龙.视频通信技术发展趋势探讨[J].电视技术，2019，43（13）：78-80.

[7]张晓娟，高瑾.计算机图像识别技术的应用及细节问题阐述与分析[J].电子技术与软件工程，2016（06）：89.

[8]张家怡.图像识别的技术现状和发展趋势[J].电脑知识与技术，2010，6（21）：6045-6046.

[9]马晨.基于视频流的图像识别技术发展与应用[J].电子技术与软件工程，2017（06）：78.

[10]叶晨.医学图像数字处理及识别技术研究[D].电子科技大学，2012.

[11]杨东.5G+人工智能机器视觉探索[J].通信与信息技术，2021（01）：60-63.

[12]陈环宇，高莺，李晓珂，余永华，周宇哲.基于图像识别的在线视频教育平台[J].科技创新与生产力，2018（12）：24-25+31.

[13]徐苑苑.云计算环境下的开放课程应用研究[D].华东师范大学，2013.

作者： 山东科技大学高俊杰 来源： 《中国新通信》2022年第7期