精选报告 | 室内数字三维场景评估方法

学术   科技   2024-09-26 16:13   北京  

点击文末 “阅读原文” 下载全文

张浩然, 张少魁, 孙博远, 林鑫杰, 刘家宏, 陈学斌, 陈境焕, 张松海

清华大学美术学院
清华大学计算机科学与技术系
清华大学工程物理系
广州极点三维信息科技有限公司


引用本文: 张浩然, 张少魁, 孙博远, 林鑫杰, 刘家宏, 陈学斌, 陈境焕, 张松海. 室内数字三维场景评估方法[J/OL]. 计算机辅助设计与图形学学报: 1-12[2024-09-26]. https://www.jcad.cn/article/doi/10.3724/SP.J.1089.2024-00352

Citation: Zhang Haoran, Zhang Shaokui, Sun Boyuan, Lin Xinjie, Liu Jiahong, Chen Xuebin, Chen Jinghuan, and Zhang Songhai. The Evaluable Measurements for Interior Digital 3D Scenes[J/OL]. Journal of Computer-Aided Design & Computer Graphics: 1-12[2024-09-26]. https://www.jcad.cn/article/doi/10.3724/SP.J.1089.2024-00352

点击播放精选报告视频
感谢清华大学硕士研究生张浩然与张少魁老师录制并提供论文讲解视频!本文为GDC2024大会推荐论文,同时获得2024年GDC年度最佳论文奖。通过严格评审后,已被《计算机辅助设计与图形学学报》录用并在期刊官网最新录用版块上线。



数字三维场景在虚拟现实、艺术、建筑、室内设计等众多领域起着至关重要的作用. 场景生成技术能够在短时间内自动生成大量三维场景, 降低人工创建场景的成本. 然而, 现有的工作往往更加注重提升场景生成的规模与自动化程度, 生成场景在具有一定合理性的同时, 可能在美学、人因等方面存在缺陷. 因此, 为了保障生成场景各方面的质量, 需要从功能、美学和人因角度对三维场景进行多方面评价.

本文提出面向功能、美学和人因的室内数字三维场景评估方法. 首先基于规则和数据分布进行多角度的场景质量评估, 并定量表示评估结果, 该过程具有较强的可解释性; 然后结合物件局部和场景整体构建综合的场景功能质量评估准则; 再综合平面构图评估和人视点图像内容评估, 提出多角度的场景美学质量评估方法; 最后结合人类活动模拟和环境模拟, 通过度量活动主体的流线和客观环境的舒适度, 整体评估场景的人因质量.


相关工作

本文工作主要涉及场景生成和场景评估. 前者需要通过场景质量的量化评价生成三维场景; 后者虽然有着明确的评估标准, 但是尚未建立包含功能、美学和人因工程学在内的完善评估体系.

○ 场景生成

众多场景生成方法都依赖先验数据生成新的三维场景. 场景生成技术本质上是通过建立一系列先验知识, 评估现有物体如何与这些先验知识相匹配. 先验可以分为基于规则的先验、数据驱动的先验和神经先验. 通常, 场景生成过程根据先验对场景进行计算, 如桌椅之间的相对位置关系是否符合空间分布. 

虽然基于规则的先验和数据驱动的先验都在物件层面表示场景关系, 专注于物体之间的空间关系, 用于对物体进行变换; 但在现实情况下, 应当从整体出发评估场景. 尽管神经网络具备接受整个场景作为输入的能力, 但人们对神经网络的运作过程并不清晰, 其评估过程缺乏可解释性.

○ 场景评估

已有的场景评估工作关注场景的丰富性、准确性和合理性, 主要度量整体指标, 对于具体指标讨论较少. 在度量场景的质量时, 一些研究通过用户实验评估生成场景的自然程度或者生成结果的可信度. 另一方面, 成本函数常被用于量化评估指标.  因此, 需要建立从功能、美学和人体工程学等多个维度进行评估的完整系统.


本文方法

本文提出室内数字三维场景评估方法, 为了构建可解释的场景评估体系, 提出包含功能、美学和人因3方面的评价维度, 共计10项自动评估室内三维场景的指标, 该方法的框架如图1所示. 评估框架包括先验提取、场景度量和度量分布三部分. 场景评估前需要从三维场景数据集提取先验数据(左中), 并统计评估指标度量值的分布. 对于输入场景, 首先度量10项功能、美学和人因准则的评估指标(右上). 功能准则包括可达性、可见性、开阔度、关联关系和功能比例; 美学准则包括平衡性、齐整度与和谐性; 人因准则包括流线合理性和活动舒适度. 然后根据数据库度量值分布计算结果(右下). 评估结果包含10个维度(左下), 具有较好的可解释性.

图1  评估方法框架

在功能方面, 通过考察场景物件的功能完备性, 为每个物体类别定义可达空间、可视空间、功能空间、开阔度、关联关系和功能比例. 其中, 可达性指标衡量某个物体可达空间与周边环境的冲突程度; 可见性指标关注物体在特定方向上的可视空间(如电视正面)与环境的冲突; 开阔度指标基于物体间功能空间重叠区域的大小计算, 确保物体周边区域通行无阻; 成对关系指标利用数据集中提取的空间关系先验知识, 计算物体对的相对距离和朝向与先验的差异, 衡量物体组合是否合理; 功能比例指标则用于评估家具所呈现的房间功能与其原本用途的契合程度.
在美学方面, 从几何角度评估室内场景的视觉质量. 平衡性指标通过衡量物体面积加权中心点相对于房间中心点的偏移程度进行评估; 齐整度指标通过聚类来评估物体与物件簇整体方向的偏离程度; 在和谐性指标的计算中, 选取房间内的若干良好视点, 评估从虚拟摄像机获取的场景视图.
在人因方面, 通过模拟人类活动考察场景质量. 在流线合理性指标中, 使用快速搜索随机树(RRT)算法模拟用户在特定布局中的可能活动流线, 并对流线进行评估; 在活动舒适度指标中, 考察用户在场景中的可能活动, 并计算照明和通风条件是否能够满足不同活动的需求

实验及结果分析

1.  数据集与实验结果

本文实验中, 先验数据提取自3D-Front数据库, 其中包含超过7万个场景, 能够为评估过程的数据分布学习提供丰富的先验数据来源. 图2所示为利用本文方法对该数据库场景进行评估的部分结果, 雷达图显示了场景10项评估指标的质量评分.

图2  数据库场景评估结果

2.  场景评估实验结果
在三维场景度量方面, 通过用户实验, 评估与专业室内设计师相比本文方法的有效性. 评估过程中, 从室内设计公司邀请5位专业室内设计师作为被试, 并向设计师详细说明本文10项评估指标的评估目的, 但并未解释各项评分的算法和实现细节, 以提高评分的客观性. 要求设计师根据室内设计专业知识, 分别从10个维度为50个场景打分, 取其均值作为专业评分; 然后使用本文方法评估相同场景, 对人工评分结果和本文方法评分结果进行对比分析.
由于设计师评分与本文方法的评分区间不同, 本文对评估结果进行归一化处理, 并对各项评分之差的绝对值取平均得到场景的平均评分差异, 以此对场景排序. 表1所示为差异最小和差异最大的各10个场景的平均评分差异和平均方差. 图3所示为部分场景评分结果的可视化图表. 可以看出, 本文方法在多数场景中能与设计师达成较好的一致, 表明本文方法能够以接近设计师专业水准的方式进行场景质量评估; 由于设计师评分时可能受主观偏好影响, 因此最终评估结果与设计师存在一定差异.

图3  对比实验结果

3.  场景生成实验结果
将本文方法与2种生成方法进行比较, 这2种方法都在生成过程中进行场景评估. 由于本文方法主要用于评估场景, 并且更多地在场景尺度进行评估, 而非在对象尺度评估, 因此在同一场景中, 10项评估指标的反复计算会耗费较多时间.
2种对比方法和本文方法都在相同的空房间集合下生成场景, 该空房间是从3D-Front数据库中随机选取的30个房间, 每个房间分别使用3种方法进行生成布局. 部分生成结果如图4所示.

图4  3种方法的生成结果

本文邀请20位被试对生成结果进行评估. 每位被试收到一份包含10个不同房间的问卷, 每个房间都使用3种方法生成了不同场景. 被试需要对场景进行功能、美学和人因3方面的评价和总体评价, 分值范围为1~5分. 评估结果如表2所示. 可以看出, 本文方法在场景生成中具有良好的效果, 在功能、美学和人因评估中都优于对比方法



结    语

针对室内三维场景的度量问题, 本文从功能、美学和人因3方面提出10项评估指标, 完善室内场景评估的准则. 在此基础上, 设计师可以更加精确地评估和改进室内设计, 研究人员也能够更好地理解和优化场景生成算法. 

场景评估实验结果表明, 本文指标能够以一定的专业设计水平评估室内场景. 场景生成实验中, 本文方法取得了良好的效果, 但需耗费较多时间. 由于室内场景评估的复杂性, 未来本文方法仍待改进, 例如, 功能准则依赖特定规则从现有数据集提取先验知识, 而这一过程需要耗费较多时间; 美学准则以几何评估为主, 并未考虑实际家具的颜色、纹理、风格等因素; 人因准则中, 仅仅考虑了光照和通风条件, 而更为完善的人因评估还应当包含活动环境的人体工学合理性、活动便捷性等因素. 在实际评估中, 考虑到用户的功能、美学和人因偏好, 以及评估场景的多种评估需求, 应当通过用户预调研、数据拟合等方式设计多套可调整参数配置, 以满足不同评估情境的需求. 另外, 本文方法的评估结果与设计师的评估结果仍有一定差异. 未来将继续改进本文方法, 提高评估模型在现实场景的应用性.




张浩然: 硕士研究生, 主要研究方向为三维场景生成.

张少魁: 博士, 助理研究员, CCF会员, 主要研究方向为三维场景布局和交互. 

孙博远: 在校学生, 主要研究方向为三维场景生成. 

林鑫杰: 在校学生, 主要研究方向为三维场景生成.

刘家宏: 硕士研究生, 主要研究方向为三维场景生成. 

陈学斌: 学士, 系统架构师, 主要研究方向为CAD&CG、深度学习.

陈境焕: 硕士, 主要研究方向为计算机图形学、深度学习. 

张松海: 博士, 副教授, 博士生导师, CCF会员, 主要研究方向为计算机图形学、虚拟现实、图像/视频处理.



编辑:李姝昊
审核:赵敏


— END —

还没关注?点击下方“卡片”关注,获取第一时间资讯

精选报告      


精选报告 | 基于紧凑型线性混合半侧蒙皮权重的神经辐射场人体表示方法


编辑推荐      


基于VSLAM的室内场景重建与虚实遮挡的边缘优化方法

融合局部和长距离信息的图像特征点提取

红外-点云的高精度注册及其微服务数字孪生系统应用

基于5G多接入边缘计算的云化PLC系统架构设计与应用


开源代码      


开源代码 | 基于循环双向Transformer的伪CT影像生成方法

开源代码 | 语义扩散对齐的多尺度感知医学图像分割方法

开源代码 | 基于EfficientNetV2的PCB缺陷检测算法


数据集      


数据集 | 自然场景盲文字符识别数据集


合辑荐读      


合辑荐读 | 计算机技术与传统文化论文合辑

合辑荐读 | 几何建模与优化最新论文合辑

合辑荐读 | 目标检测、目标跟踪与重识别最新论文合辑

合辑荐读 | 医学图像处理最新论文合辑

合辑荐读 | 感知与交互最新论文合辑

合辑荐读 | VR/AR/MR最新论文合辑

合辑荐读 | 三维图形计算最新论文合辑

合辑荐读 | 可视化与可视分析最新论文合辑

合辑荐读 | 《计算机辅助设计与图形学学报》最新综述论文




声明

本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。




计算机辅助设计与图形学学报
《计算机辅助设计与图形学学报》官方平台。本刊创刊于1989年,EI、Scopus、北大核心、CSCD、CSTPCD、CNKI等国内外数据库收录,CCF推荐中文科技期刊A类、计算领域高质量科技期刊T1类。期刊官网:www.jcad.cn。
 最新文章