首页 理论教育 车载多媒体支持什么格式视频

车载多媒体支持什么格式视频

时间:2023-02-24 理论教育 版权反馈
【摘要】:2000年之前,专家们就预测,多媒体计算机技术将和多处理器并行技术、面向对象的软件技术一起,称为21世纪计算机工业的三大热点课题之一。多媒体技术中的媒体指后者。多媒体计算机技术是面向三维图形图像、立体声和彩色全屏幕运动画面的处理技术。因此,多媒体数据压缩技术是多媒体计算机的关键技术。

2.5.1 多媒体的基本概念

现代科技迅猛发展的今天,人类社会已进入信息社会,计算机和神奇的多媒体使我们的世界更加丰富多彩。运用多媒体技术是计算机系统的时代特征。2000年之前,专家们就预测,多媒体计算机技术将和多处理器并行技术、面向对象的软件技术一起,称为21世纪计算机工业的三大热点课题之一。现在的实际情况是计算机都可以播放音乐、视频、动画,计算机不仅是单核,还有双核、三核、四核,面向对象的软件技术蓬勃发展。

1.多媒体

媒体在计算机领域中有两种含义:①用以存储信息的实体,如磁带、磁盘、光盘和半导体存储器等;②信息的载体,如数字、文字、声音、图形和图像等。多媒体技术中的媒体指后者。上述单个的信息载体是单媒体,显然,多媒体就是由单媒体复合而成,包含两种或者两种以上的单媒体。

2.多媒体计算机技术

多媒体计算机技术(Multimedia Computing Technology)是指用计算机综合处理文本、图形、图像、音频和视频等多种媒体信息,使他们建立逻辑连接,集成为一个具有交互性的系统。

3.多媒体关键技术

多媒体关键技术主要有数据压缩技术、大规模集成电路(VLSI)制造技术、大容量的光盘存储器、实时多任务操作系统。

4.多媒体系统

多媒体系统主要有多媒体硬件系统、多媒体操作系统、媒体处理系统工具和用户应用软件。

2.5.2 多媒体数据压缩

多媒体计算机技术是面向三维图形图像、立体声和彩色全屏幕运动画面的处理技术。为达到令人满意的视频画面质量和听觉效果,就要对视频信号和音频信号进行实时处理。实现实时处理技术所面临的首要问题是解决计算机系统对庞大的视频和音频信号数据的吞吐、传输和存储。因此,多媒体数据压缩技术是多媒体计算机的关键技术。

1.数据压缩的重要性

数字化视频和音频信号的数据量之大是非常惊人的。一幅具有中等分辨率640×480(像素/英寸)的真彩色(24位)数字视频图像的数据量约900KB(千字节),一个2GB的磁盘只能存放大约2200帧静止图像画面。如果帧速率为25帧/秒,那么要求视频信号的传输速率大约为23MB/s。对于音频信号,以CD-DA声音数据为例,采用PCM采样,采样频率44.1kHz,每个采样点为16位,双通道立体声,650MB的CD-ROM光盘仅能存储大约一个小时的录音。当我们通过网络传输多媒体信息时,巨大的数据量会给网络带来沉重的负担。在时间上,也会使网络用户们难以接受。

如此庞大的数据量对存储器容量和网络传输速度都提出了严峻挑战。如果不经过压缩,即使采用了DVD-ROM和高速通信网络,也很难满足要求。由此可见,高效实时地压缩视频和音频信号是多媒体系统中不可回避的关键技术问题,否则多媒体技术难以推广应用。

2.数据压缩的方法

由于多媒体数据中存在各种冗余,因此多媒体数据是可以被压缩的。针对不同的冗余,人们提出了多种方法压缩多媒体数据。

数据压缩处理一般由编码过程和解码过程组成。编码过程将原始数据经过编码进行压缩,以便于存储和传输;解码过程对编码数据进行解码,还原为可以使用的数据。

根据解码后的数据与原始数据是否完全一致可将数据压缩方法分为以下两类。

(1)无损压缩,又叫可逆编码方法,该方法的解码图像与原始图像完全相同,即压缩是完全可恢复的或没有偏差的。

(2)有损压缩,又叫不可逆编码方法,该方法的还原图像较原始图像存在一定的误差,但实际效果一般是可接受的。因此该方法被用在把人类视觉作为对象的场合下。

2.5.3 图形与图像

多媒体计算机需要计算机综合处理声、文、图信息,根据一项心理学测定,进入人类大脑的信息约有80%来自视觉,10%来自听觉,另外10%来自其他感觉器官。客观世界较多应该是景物和图像,语言和文字是对客观事物的一种描述。在日常生活中人们会发现,有时用语言和文字难以表达的事物,用一张简单的图就能精辟而准确地表达。

1.颜色的基本概念

颜色可以用亮度、色调和饱和度来描述,人眼看到任意彩色光都是这3个特征的综合效果。

2.HSI彩色空间

HSI彩色空间是从人的视觉系统出发,用色调(Hue)、饱和度(Saturation或Chroma)和亮度(Intensity或Brightness)来描述色彩。其中色调与光波的波长有关,它表示人的感官对不同颜色的感受,如红色、绿色等,它也可表示一定范围的颜色,如暖色、冷色等。饱和度表示颜色的纯度,纯光谱色是完全饱和的,加入白光会稀释饱和度。颜色饱和度越大越鲜艳,反之亦然。亮度对应成像亮度和图像灰度,是颜色的明亮程度。

3.三基色(RGB)原理

三基色是指红(Red)、绿(Green)、蓝(Blue)三色。人眼对红、绿、蓝最为敏感,大多数的颜色可以通过红、绿、蓝三色按照不同的比例合成产生。同样,绝大多数单色光也可以分解成红、绿、蓝三种色光。这是色度学的最基本原理,即三基色原理。红、绿、蓝三基色按照不同的比例相加合成混色称为相加混色,除了相加混色法之外还有相减混色法。可根据需要相加相减调配颜色。

4.常见的图像文件格式

图像文件分类的标准各不相同,例如,由于各种不同类型的图像采用的压缩方法不相同,因此可以根据图像文件所采用的压缩方法对图像文件进行分类,也可以按照图像文件数据的组织特征进行分类。下面按照图像数据特征进行分类,可以分为位图和矢量图。

5.位图文件

位图又叫点阵图,它是一种由许多点(称为像素)排列组合成的图像,这类图像文件容量较大。放大位图文件会产生边缘锯齿、图像马赛克化现象。生活中常见的十字绣和点阵图类似,近看时有锯齿边缘。位图以固定数量的像素来表现图像数据。它的清晰度受显示或打印设备的分辨率和图像文件自身的分辨率影响。只要有足够多的不同色彩的像素,就可以制作出色彩丰富的位图图像。位图文件一般容量较大,放大或缩小时容易失真。加工位图图像的软件有PhotoShop、画图等。位图文件的格式如下。

(1)BMP(Bitmap)格式。BMP是DOS和Windows兼容计算机系统的标准Windows图像格式。BMP格式支持RGB、索引颜色、灰度和位图颜色模式,但不支持Alpha通道。BMP格式支持1、4、24、32位的RGB位图。

(2)TIFF(Tag Image File Format,标记图像文件格式)。TIFF用于在应用程序之间和计算机平台之间交换文件。TIFF是一种灵活的图像格式,被所有绘画、图像编辑和页面排版应用程序支持。几乎所有的桌面扫描仪都可以生成TIFF图像。而且TIFF格式还可加入作者、版权、备注以及自定义信息,存放多幅图像。

(3)GIF(Graphic Interchange Format,图像交换格式)。GIF是一种LZW压缩格式,用来最小化文件大小和信息传递时间。在万维网和其他网上服务的HTML(超文本标记语言)文档中,GIF文件格式普遍用于现实索引颜色和图像。GIF支持灰度模式。

(4)JPEG(Joint Photographic Experts Group,联合图片专家组)格式。JPEG是目前所有格式中压缩率最高的格式。目前大多数彩色和灰度图像都用JPEG格式压缩,压缩比很大且支持多种压缩级别的格式,当对图像的精度要求不高而存储空间又有限时,JPEG是一种理想的压缩方式。在万维网和其他网上服务的HTML文档中,JPEG用于显示图片和其他连续色调的图像文档。JPEG支持CMYK、RGB和灰度颜色模式。JPEG格式保留RGB图像中的所有颜色信息,通过选择性地去掉数据来压缩文件。

(5)PSD格式是Adobe公司的图像处理软件Photoshop的专用格式。其中包含各种图层、通道、遮罩等设计,再次打开时可以延续上一次的编辑加工。Photoshop支持的所有图像格式中,PSD格式存取速度快、功能强大。

(6)PNG格式是一种新兴的网络图像格式。它结合了JPEG和GIF的优点,采用无损压缩,但不支持动画效果。Macromedia公司的Fireworks的默认文件格式就是PNG。

6.矢量图文件

矢量图以数学的向量方式来记录图像内容。矢量图最大的优点是文件小,放大或缩小时不会失真。但这种图像不易制作色彩变化太多的图像。加工矢量图图像的软件有Flash、CorelDRAW等。下面介绍常见的WMF矢量图文件。

WMF(Windows Metafile,图元文件)文件是Microsoft Office剪贴画使用的图像格式,是微软公司定义的一种Windows平台下的图形文件格式。

目前只有Microsoft Windows操作平台支持WMF格式文件,其他操作系统(如UNIX、LINUX等)尚不支持这种格式。与BMP格式不同,WMF格式文件与设备无关,即其输出特性不依赖于具体的输出设备;其图像完全由Win32 API所拥有的GDI函数来完成。WMF格式文件所占的磁盘空间比其他任何格式的图形文件都要小得多。在建立图元文件时,WMF不能实现即画即得,而是将GDI调用记录在图元文件中,之后,在GDI环境中重新执行,才可显示图像。因此显示图元文件的速度比显示其他格式的图像文件慢,但是它形成图元文件的速度要远大于其他格式。

位图和矢量图的区别见表2.2。

表2.2 位图与矢量图的区别

alt

2.5.4 动态图像

动态图像包括动画和视频信息,是连续渐变的静态图像或图形序列沿时间轴顺次更换显示,从而构成运动画面。我们所看到的动态图像实际上是由许多单一的画面所组成的,每幅画面称为一帧。由于人眼的视觉惰性,每秒24帧的电影画面就形成了连续活动影像感觉的电影。帧是构成动画和视频信息的最小和最基本的单元。当序列中每帧图像是由人工或计算机产生,就称为动画;当序列中每帧图像是通过实时摄取自然景象或活动对象时,就称为视频。

1.动画

动画采用图形与图像的处理技术,借助于编程或动画制作软件生成一系列的景物画面,其中当前帧是前一帧的部分修改。计算机动画是采用连续播放静止图像的方法产生物体运动的效果。所谓动画也就使一幅图像“活”起来的过程。使用动画可以清楚地表现出一个事件的过程,或是展现一个活灵活现的画面。实验证明,动画和电影的画面刷新率为24帧/s(每秒放映24幅画面)时人眼看到的是连续的画面效果。计算机动画的关键技术体现在计算机动画制作软件及硬件上。

计算机动画分二维动画和三维动画。二维动画指平面上的画面。纸张、照片或计算机屏幕显示,无论画面的立体感多强,终究是二维空间上模拟真实三维空间效果。三维动画是指画中的景物有正面、侧面和反面,调整三维空间的视点,能够看到不同的内容。

常用二维动画软件有Animator Studio、Flash、Retas和Pegs。Animator Studio是基于Windows系统下的一种集动画制作、图像处理、音乐编辑、音乐合成等多种功能为一体的二维动画制作软件。Flash是交互动画制作工具,多应用于网页制作及多媒体课程。Retas是日本生产的一种计算机二维动画软件。Pegs是法国生产的一种计算机二维动画软件。

三维动画的制作首先要创建物体模型,然后让这些物体在空间动起来,如移动、旋转、变形、变色。再通过打灯光等后期处理生成栩栩如生的画面。创作一个三维动画需要经过造型、动画、绘图等三个过程。

2.视频及视频信号数字化

视频一词译自英文Video,电影和电视都属于视频的范畴。视频信息容量大,通过视觉获得的视频信息的信息量往往比通过其他感觉获取的信息量更大。视频信息具有确切、直观、具体、生动、效率高以及应用广等优点。视频信号数字化主要包括视频信号的扫描、抽样、量化、编码等过程。

3.视频文件格式

(1)MPEG文件格式。

MPEG(Moving Pictures Experts Group/Motion Pictures Experts Group,动态图像专家组)标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。该专家组建于1988年,专门负责为CD建立视频和音频标准,其成员都是视频、音频及系统领域的技术专家。他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO/IEC1172压缩编码标准,并制定出MPEG-格式,令视听传播进入了数码化时代。因此,大家现时泛指的MPEG-X版本,就是由ISO(International Organization for Standardization)所制定而发布的视频、音频、数据的压缩标准。

MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。

(2)AVI。

AVI(Audio Video Interleaved,音频视频交错格式)是将语音和影像同步组合在一起的文件格式。它对视频文件采用了一种有损压缩方式,但压缩比较高,因此尽管画面质量不是太好,但其应用范围仍然非常广泛。AVI支持256色和RLE压缩。AVI信息主要应用在多媒体光盘上,用来保存电视、电影等各种影像信息。

AVI包含文件头、数据块和索引块。其中,数据块包含实际数据流,即图像和声音序列数据。这是文件的主体,也是决定文件容量的主要部分。视频文件的大小等于该文件的数据率乘以该视频播放的时间长度,索引块包括数据块列表和它们在文件中的位置,以提供文件内数据随机存取能力。文件头包括文件的通用信息,定义数据格式,所用的压缩算法等参数。

2.5.5 数字化音频

计算机能够进行交互式综合处理声文图信息是多媒体技术的特点。声音是携带信息的重要媒体。娓娓动听的音乐和解说,使静态图像变得更加丰富多彩。音频和视频的同步,使视频图像更具真实性。传统计算机与人之间的交互是通过键盘和显示器,人们通过键盘或鼠标输入,通过视觉接收信息。而今天的多媒体计算机是为计算机增加音频通道,采用人们最熟悉、最习惯的方式与计算机交换信息。

1.音频信号数字化

声音是机械振动,振动越强,声音越大,话筒(麦克风)把机械振动转换成电信号,模拟音频技术以模拟电压的幅度表示声音的强弱。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体(如磁带或者唱片)上,播放时将记录在媒体上的信号还原为声音波形。计算机内的音频必须是数字形式,即数字音频,因此必须把模拟音频信号转换成有限个数字表示的离散序列,即实现音频数字化。

对模拟数据进行数字编码,就是要把它转换成一系列在时间和取值上都是离散的二进制数码脉冲,最长的编码方法就是脉冲编码调制技术PCM。PCM包括采样、量化和编码三个步骤。

2.音频文件格式

(1)WAV文件。

WAV是微软公司开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1k的取样频率,16位量化数字,因此在声音文件质量和CD相差无几!

(2)MP3文件。

MP3(Moving Picture Experts Group Audio Layer Ⅲ,动态影像专家压缩标准音频层面3)是当今较流行的一种数字音频编码和有损压缩格式。它用来大幅度地降低音频数据量,而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。

MP3将音乐以1∶10甚至1∶12的压缩率压缩成容量较小的文件,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。MP3体积小、音质高的特点使得MP3格式几乎成为网上音乐的代名词。每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3M~4MB。使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。

(3)MIDI文件。

MIDI(Musical Instrument Digital Interface,乐器数字接口)是20世纪80年代初为解决电声乐器之间的通信问题而提出的。MIDI传输的不是声音信号,而是音符、控制参数等指令,它指示MIDI设备做什么、怎么做,如演奏的音符及音量等被统一表示成MIDI消息。传输时采用异步串行通信,标准通信波特率为31.25×(1±0.01)KBaud。

MIDI文件有很多信息构成的指令。一些信息只有1~3B。有一类MIDI信息甚至包含无限的字节数。所有的信息的共同点就是第一个字节的信息是状态。

2.5.6 多媒体创作

1.多媒体创作工具简介

多媒体创作工具必须担当起可视化编程的责任,它必须具有概念清楚、界面简洁、操作简单以及功能伸缩性强等特点。近年来,随着多媒体应用系统需求的日益增长,许多公司都非常重视多媒体创作工具及其产品,并大力开发,从而使多媒体创作工具日新月异。每一种多媒体创作工具都提供了不同的应用开发环境,并具有各自的功能和特点,适用于不同的应用范围。根据创作方法和特点的不同,多媒体创作工具可以分为4类。

(1)基于时间的创作工具。通过这类多媒体创作工具制作出来的节目最像电影或卡通片,其典型产品有Director和Action等。

(2)基于图标或流线的创作工具。在这些创作工具中,多媒体成分和交互队列(事件)按结构化框架或过程组织为对象,其典型产品有Authorware和IconAuthor等。

(3)基于卡片或页面的工具。这类多媒体创作工具是以面向对象的方式来处理多媒体元素的,它提供一种可以将对象连接于页面或卡片的工作环境。在多媒体创作工具中,可以将这些页面或卡片连接成有序的序列,其典型产品有ToolBook及HyperCard。

(4)以传统程序语言为基础的创作工具。这类多媒体创作工具需要大量编程,可重复性差,不便于组织和管理多媒体素材,并且调试困难,如Visual C++、Visual Basic。

2.多媒体创作过程

多媒体的创作一般可分为6个步骤:概念、设计、准备素材、集成、测试以及发行。它与一部电影的制作有些类似。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈