学科方向

参阅 什么是计算机图形学?

计算机图形学学科方向

在学科开创之初,计算机图形学要解决的是如何在计算机中表示三维几何图形,以及如何利用计算机进行图形的生成、处理和显示的相关原理与算法,产生令人赏心悦目的真实感图像。这是狭义的计算机图形学的范畴。随着近 40 年的发展,计算机图形学的内容已经远远不止这些了。广义的计算机图形学的研究内容非常广泛,如图形硬件、图形标准、图形交互技术、光栅图形生成算法、曲线曲面造型、实体造型、真实感图形计算与显示算法,以及科学计算可视化、计算机动画、自然景物仿真、虚拟现实等。

概括而言,计算机图形学主要包含四大部分的内容:建模(Modeling)、渲染(Rendering)、动画(Animation)和人机交互(Human–computer Interaction, HCI)。

  • 基于图形设备的基本图形元素的生成算法如用光栅图形显示器生成直线、圆弧、二次曲线、封闭边界内的图案填充等。

  • 图形元素的几何变换即对图形的平移、放、缩小、旋转、镜像等操作。

  • 自由曲线和曲面的值、拟合、拼接、分解、过渡、光顺、整体和局部修改等。

  • 三维几何造型技术,包括对基本体素的定义及输入、规则曲面与自由曲面的造型技术,以及它们之间的布尔运算方法的研究。

  • 三维形体的实时显示,包括投影变换、窗口剪裁等。

  • 真实感图形的生成算法,包括三维图形的消隐算法、光照模型的建立、阴影层次及彩色浓淡图的生成算法。

  • 山、水、花、草、烟云等模糊景物的模拟生成和虚拟现实环境的生成及其控制算法等。

  • 科学计算可视化和三维或高维数据场的可视化,包括将科学计算中大量难以理解的数据通过计算机图形显示出来,从而加深人们科学过程的理解,例如,有限元分析的结果等;应力场、磁场的分布等;各种复杂的运动学和动力学问题的图形仿真等。

建模(Modeling)

要在计算机中表示一个三维物体,首先要有它的几何模型表达。因此,三维模型的建模是计算机图形学的基础,是其他内容的前提。表达一个几何物体可以是用数学上的样条函数或隐式函数来表达;也可以是用光滑曲面上的采样点及其连接关系所表达的三角网格来表达(即连续曲面的分片线性逼近),如下图所示。

3D 建模示意图

三维建模方法主要包含如下的一些方法:

  • 计算机辅助设计(CAD)中的主流方法是采用 NURBS(非均匀有理 B-样条、Bezier 曲线曲面)方法(已成为 CAD 工业领域的标准),这也是计算机辅助几何设计(CAGD)所研究的主要内容。此类表达方法有一些难点问题仍未解决,比如非正规情况下的曲面光滑拼合,复杂曲面表达等。这部分涉及的数学比较多,国内做这块的学者比较多些。

  • 细分曲面(Subdivision surface)造型方法,作为一种离散迭代的曲面构造方法,由于其构造过程朴素简单以及实现容易,是一个方兴未艾的研究热点。经过十多年的研究发展,细分曲面造型取得了较大的进展,包括奇异点处的连续性构造方法以及与 GPU 图形硬件相结合的曲面处理方法。

  • 利用软件的直接手工建模。现在主流的商业化的三维建模软件有 Autodesk 3D Max 和 Maya。其他还有面向特定领域的商业化软件,比如面向建筑模型造型的 Google Sketchup,面向 CAD/CAM/CAE 的 CATIA 和 AutoCAD,面向机械设计的 SolidWorks,面向造船行业的 Rhino 等。这些软件需要建模人员有较强的专业知识,而且需要一定时期的培训才能掌握,建模效率低而学习门槛高,不易于普及和让非专业用户使用。

  • 基于笔划或草图交互方式的三维建模方法。草图交互方式由于其符合人类原有日常生活中的思考习惯,交互方式直观简单,是最近几年研究的热点建模方法。其难点是根据具体的应用场合,如何正确地理解和识别用户的交互所表达的语义,构造出用户所希望的模型。

  • 基于语法及规则的过程式建模方法。特别适合具有重复特征和结构化的几何物体与场景,比如建筑、树木等。最近几年有较多的论文及较大的发展。

  • 基于图像或视频的建模方法。这是传统的计算机视觉所要解决的基本问题。在计算机图形学领域,这方面的发展也很迅速。有一些商业化软件或云服务(比如 Autodesk 的 123D),已经能从若干张照片重建出所拍摄物体的三维模型。该方法的问题是需要物体本身已经存在,而且重建的三维模型的精度有限。

  • 基于扫描点云(深度图像如 Kinect、结构光扫描、激光扫描、LiDAR 扫描等)的建模(Reconstruction)方法。随着深度相机的出现及扫描仪的价格迅速下降,人们采集三维数据变得容易,从采集到的三维点云来重建三维模型的工作在最近几年的 Siggraph(Asia)上能常见到。但是,单纯的重建方式存在精度低、稳定性差和运算量大等不足,远未能满足实际的需求。

  • 基于现有模型来合成建模的方法。随着三维模型的逐渐增多,可以利用现有的三维模型通过简单的操作,比如 cut and paste,或者分析及变形等手段,来拼接或合成新的三维模型。这种通过“学习”模型数据库的知识来进行建模的手段在近 3-5 年里研究得非常热门。从某方面来讲,就是“大数据时代”背景下计算机图形学领域中的一个具体的表现。

在对三维几何模型的构建过程中,还会涉及到很多需要处理的几何问题,比如数据去噪(denoising or smoothing)、补洞(repairing)、简化(simplification)、层次细节(level of detail)、参数化(parameterization)、变形(deformation or editing)、分割(segmentation)、形状分析及检索(shape analysis and retrieval)等。

渲染(Rendering)

有了三维模型或场景,怎么把这些三维几何模型画出来,产生令人赏心悦目的真实感图像?这就是传统的计算机图形学的核心任务,在计算机辅助设计,影视动漫以及各类可视化应用中都对图形渲染结果的高真实感提出了很高的要求。上个世纪 80-90 年代研究的比较多些,包含了大量的渲染模型,包括局部光照模型(Local Illumination Model)、光线跟踪算法(Ray Tracing)、辐射度(Radiosity)等,以及到后面的更为复杂、真实、快速的渲染技术,比如全局光照模型(Global Illumination Model)、Photo mapping、BTF、BRDF、以及基于 GPU 的渲染技术等。

渲染效果示意图

现在的渲染技术已经能够将各种物体,包括皮肤、树木、花草、水、烟雾、毛发等渲染得非常逼真。一些商业化软件(比如 Maya, Blender, Pov Ray 等)也提供了强大的真实感渲染功能,在计算机图形学研究论文中作图中要经常用到这些工具来渲染漂亮的展示图或结果图。然而,已知的渲染实现方法,仍无法实现复杂的视觉特效,离实时的高真实感渲染还有很大差距,比如完整地实现适于电影渲染(高真实感、高分辨率)制作的 RenderMan 标准,以及其他各类基于物理真实感的实时渲染算法等。因此,如何充分利用 GPU 的计算特性,结合分布式的集群技术,从而来构造低功耗的渲染服务是发展趋势之一。

动画(Animation)

动画是采用连续播放静止图像的方法产生物体运动的效果。计算机动画借助于编程或动画制作软件生成一系列的景物画面,是计算机图形学的研究热点之一。研究方向包括:人体动画,关节动画,运动动画,脚本动画,具有人的意识的虚拟角色的动画系统等。另外,高度物理真实感的动态模拟,包括对各种形变、水、气、云、烟雾、燃烧、爆炸、撕裂、老化等物理现象的真实模拟,也是动画领域的主要问题。这些技术是各类动态仿真应用的核心技术,可以极大地提高虚拟现实系统的沉浸感。计算机动画的应用领域广泛,比如动画片制作,广告、电影特技,训练模拟,物理仿真,游戏等。

人机交互(Human–Computer Interaction, HCI)

人机交互(Human-Computer Interaction, 简写 HCI)是指人与计算机之间以一定的交互方式或交互界面,来完成确定任务的人与计算机之间的信息交换过程。简单来讲,就是人如何通过一定的交互方式告诉计算机来完成他所希望完成的任务。计算机图形学的顶级会议 ACM SIGGRAPH 是“ACM Special Interest Group on GRAPHics and Interactive Techniques”的缩写,缩写中只包含了 Graphics,而忽略了 Interactive Techniques,在长时间没有得到计算机图形学研究的重视。最近,包括在 SIGGRAPH 会议上,以及人机交互的顶级会议 SIGCHI 上,陆续出现了许多新兴的人机交互技术及研究论文。大家逐渐重视起来。

在早期(上个世纪 60-70 年代),只有以键盘输入的字符界面;到了 80 年代,以 WIMP(窗口、图符、菜单、鼠标)为基础的图形用户界面(GUI)逐渐成为当今计算机用户界面的主流。近年来,以用户为中心的系统设计思想,增进人机交互的自然性,提高人机交互的效率是用户界面的主要研究方向。陆续提出了多通道用户界面的思想,它包括语言、姿势输入、头部跟踪、视觉跟踪、立体显示、三维交互技术、感觉反馈及自然语言界面等。

事实上,人体的表面本身就是人机界面。人体的任何部分(姿势,手势,语言,眼睛,肌肉电波,脑波等)都可以成为人机对话的通道。比如 2010 年微软出的 Kinect 就是一种无需任何操纵杆的基于体感的人机界面,用户本身就是控制器。Kinect 在微软的 Xbox 游戏上取得了极大的成功,之后在其他方面也得到了很多的应用。

其他

上述所提到的只是计算机图形学的主要的四个内容。事实上,与计算机图形学相关的学科还有很多,以下仅介绍几个最为相关的研究方向:

l 虚拟现实(Virtual Reality):利用计算机图形产生器,位置跟踪器,多功能传感器和控制器等有效地模拟实际场景和情形,从而能够使观察者产生一种真实的身临其境的感觉。虚拟现实技术主要研究用计算机模拟(构造)三维图形空间,并使用户能够自然地与该空间进行交互。对三维图形处理技术的要求特别高。简单的虚拟现实系统早在 70 年代便被应用于军事领域,训练驾驶员。80 年代后随着计算机软硬件技术的提高,它也得到重视并迅速发展。它已在航空航天、医学、教育、艺术、建筑等领域得到初步的应用。

  • 可视化(Visualization):利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。现已成为研究数据表示、数据处理、决策分析等一系列问题的综合技术。上面提到的虚拟现实技术也是以图形图像的可视化技术为依托的。在现在的大数据时代的背景下,可视化的内容除了传统的科学可视化外,现在还有信息可视化,可视分析等方面。

  • 可视媒体计算与处理(Visual Media Processing):几何数据,被认为是继声音、图像、视频之后的新一代数字媒体,是计算机图形学的研究重点。最近几年,计算机图形学与图像视频处理技术相结合的研究与技术日益增多。正如笔者在上面所提及的,图像和视频的大数据处理能带给计算机图形学很多处理手段上的更新。另一方面,随着而计算机图形学技术,恰可以与这些图像处理,视觉方法相交叉融合,来直接地生成风格化的画面,实现基于图像三维建模,以及直接基于视频和图像数据来生成动画序列。当计算机图形学正向地图像生成方法和计算机视觉中逆向地从图像中恢复各种信息方法相结合,可以带来无可限量的想象空间,构造出很多视觉特效来,最终用于增强现实、数字地图、虚拟博物馆展示等多种应用中去。因此,在很多方面,计算机图形学与图像处理、视频处理、多媒体处理、计算机视觉等学科逐渐融合在一起,有成为一个更大的学科的趋势。

  • 医学图像处理(Medical Imaging):随着医学成像技术的发展与进步,图像处理在医学研究与临床医学中的应用越来越广泛。与一般意义上的图像处理比较,医学图像处理有其特殊性和不同的侧重点。医学图像处理由生物医学成像(X 射线、CT、MRI)和生物医学图像处理两部分组成,在生命科学研究、医学诊断、临床治疗等方面起着重要的作用。医学图像分析中涉及的两个最为重要的内容为图像分割与图像配准。

  • 计算机艺术(Computational Arts):计算机图形学的发展也提供给了艺术家发挥和实现想象的丰富的技术手段。计算机艺术的发展速度远远超出了人们的想象,在代表计算机图形研究最高水平的历届 SIGGRAPH 年会上,精彩的计算机艺术作品层出不穷。在计算机图形学领域,还有几个关于计算艺术方面的会议,包括非真实性图形学(Non-Photorealistic Graphics)和 Computational Aesthetics(计算美学)等。吸引了计算机工作者、艺术家、建筑师、设计师等方面的人员在一起,通过头脑风暴和交流讨论的方式进行一些有创意的技术研究。

计算机图形学与图像处理

计算机图形学的基本含义是,使用计算机通过算法和程序在显示设备上构造出图形来。也就是说,图形是人们通过计算机设计和构造出来的,不是通过摄像机或扫描仪等设备输入的图像。所设计和构造的图形可以是现实世界中已经存在的物体图形,也可以显示出完全虚构的物体。因此,计算机图形学是真实物体或虚构物体的图形综合技术。与此相反,图像处理是景物或图像的分析技术。它所研究的是计算机图形学的逆过程,包括图像增强、模式识别、景物分析、计算机视觉等,并研究如何从图像中提取二维或三维物体的模型。

尽管计算机图形学和图像处理所涉及的都是用计算机来处理图形和图像,但是长期以来却属于不同的两个技术领域。近年来,由于媒体技术、计算机动画,三维空间动数据场显示及纹理映射等的迅速发展,计算机图形学和图像处理的结合日益紧密,并相互渗透。例如,将计算机生成的图形与扫描输入的图像结合起来,来构造计算机动画;用菜单或其他图形交互技术来实现交互式图像处理;通过交互手段,由一幅透视图像中提取出对称物体的三维模型并进行修改,也可由一幅图像,直接变换为另一幅图像从而代替了图形的综合等。计算机图形学与图像处理相结合,加速了这两个相关领域的发展。

上一页