RA战队勇夺上海Major晋级资格 ROG外设助力电竞征途国家安全部:警惕深度伪造技术带来的安全风险一键生成 AI 广告短视频:Tiktok 上线 Symphony Creative Studio 平台参数量仅 0.25B,成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型我国新一代地基红外天文望远镜发布首批观测图像东芝将与日本筑波大学合作,利用基因信息展开睡眠研究日企“山业”推出磁吸式网线:可减少端口损坏,传输速度 10GbpsAI投毒第一案!GPT写的代码竟有后门 程序员被骗1.8万元苹果 iPhone 16 获 DxOMark 147 分超三星 Galaxy S24 Ultra:HDR 照片明亮有活力、肤色自然准确赵明回应荣耀 GT 系列独立,或将肩负再造荣耀目标微软公布 Zero Day Quest 白帽安全竞赛:提交指定类型漏洞奖金至高可翻倍、前 45 名可受邀线下活动印度将鼓励企业本土生产手机等产品零部件:总额 40-50 亿美元我国牵头的首个工业化建造自动标识与数据采集应用国际标准发布京东 11 月 27 日起下线京享值 6000 以上“运费双免”服务,PLUS 会员“免费退换货”不受影响美团刘硕:美团无人机运营规模位列全球第一梯队谷歌“隐瞒文化”曝光:在掌握所有事实之前,不要发表评论英伟达股价大涨,黄仁勋慈善基金会今年至少要再捐 1.2 亿美元消息称莱迪思半导体正考虑收购英特尔 Altera滴滴“12 年老将”张博卸任 CTO,未来将专注自动驾驶业务毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战
  • 首页 > 企业IT频道 > ARVRMR

    高通专利为AR/VR头显佩戴用户提供自拍解决方案

    2022年08月15日 11:04:50   来源:映维网

      通过诸如智能手机等设备进行自拍或者请求别人为自己拍照十分轻松。但对于XR头戴式系统而言,由于形状参数的固有限制,生成一种自拍图像或者生成一种看似由他人拍摄的图片可能十分具有挑战性。

      在名为“Image capturing in extended reality environments”的专利申请中,高通就提出了一种解决方案。

      简单来说,用户可以“左手臂前伸,手指摆出V字胜利手势,并且露齿笑嘴角上扬”。这时,可以利用头显的朝外摄像头拍摄用户手臂前伸的手指V字姿势和现实世界场景,并通过头显的朝内摄像头拍摄用户的面容表情。然后,再通过机器学习模型整合成完整的姿势,并形成一种看似自拍,或者是由他人拍摄的图片感觉。

      但需要注意的是,由于身体姿势必须前伸以置于朝外摄像头视场之内,并且由于头显的固有遮挡限制,朝内摄像头无法确切完整地捕获面容,叠加机器学习模型的性能问题,所以最终合成的图像无法精准表达用户的姿势表情。换句话说,这种方法存在自己的限制。

      在一个实施例中,自我图像捕获系统可以包括自我图像启动引擎、Avatar引擎、背景帧引擎和合成引擎。自我图像帧可以对应于“自拍图片”或“自拍视频”。

      自我图像启动引擎可以检测与自拍图片或自拍视频过程类似的用户输入,例如语音命令、手势输入以及其他类型的输入。基于检测到用户输入,自我图像捕获系统可以启动自图像捕获过程中的下一操作。

      在一个示例中,Avatar引擎可以确定用户姿势。用户姿势可以包括和/或对应于用户的身体特征。例如,用户姿势可以包括用户当前的表情、情感、手势、肢体位置等中的一个或多个。另外,用户姿势可以包括和/或对应于用户在真实世界环境中的物理位置。Avatar引擎可以使用各种追踪和/或扫描技术和/或算法来确定用户姿势。例如,Avatar引擎3以使用一种或多种眼动追踪技术、SLAM技术、六自由度定位技术、身体追踪技术、面部表情追踪技术、计算机视觉技术、其任何组合或其他追踪和/或扫描技术来确定用户姿势。

      接下来,Avatar引擎可以生成反映用户姿势的用户Avatar。需要注意,“Avatar”可以包括用户全部或部分的任何数字表示。在一个示例中,用户的Avatar可以包括计算机生成图像数据。可选地,用户的Avatar可以包括由图像传感器捕获的图像数据。另外,用户的Avatar可以对应于用户的抽象(例如卡通)表示或用户的照片真实表示。

      在一个实施例中,Avatar引擎可以使用一个或多个机器学习系统和/或算法生成Avatar。例如,Avatar引擎可以基于使用机器学习算法对与各种用户姿势相关联的图像数据训练的机器学习模型来生成Avatar。例如,Avatar引擎可以捕获用户的一个或多个图像,例如用户的全身图像。基于捕捉到的用户姿势和用户的一个或多个图像,机器学习模型可以输出姿势与用户相似的Avatar。例如,如果捕捉到的用户姿势包括特定手势(例如“胜利手势”),则机器学习模型可以输出与做出特定手势的用户相似的Avatar。

      在一个实施例中,背景帧引擎可以捕获一个或多个背景帧。背景帧可以包括和/或对应于将成为自我图像的背景的任何帧。

      基于由Avatar引擎生成的Avatar和由背景帧生成的背景帧,合成引擎可以生成自我图像帧(或一系列自我图像帧)。例如,合成引擎可以将生成的Avatar叠加到背景帧。如上所述,Avatar引擎可以确定与用户姿势相对应的用户3D位置。因此,合成引擎可以将Avatar叠加在相应位置的背景帧内。通过这种方式,AR/VR头显就可以生成看似自拍或者看似由他人拍摄的图像感觉。

      如图4A-4C所示。在图4A中,穿戴VR头显的用户可以前伸左手并摆出V字胜利手势。这时,系统可以通过头显的前置摄像头拍摄左手前伸并且手指摆出V字胜利手势的图像,以及周遭环境的背景图像。同时,系统可以确定头显用户在环境中的特定位置。

      然后,Avatar引擎可以渲染Avatar318。同时,Avatar引擎304可以使用不同的机器学习模型来生成Avatar318(A)和318(B)。在一个示例中,Avatar引擎304(A)可以使用低保真度机器学习模型生成Avatar318(A),并使用高保真都模型生成Avatar318(B),如图4B和4C所示。换句话说,Avatar318(B)可以是Avatar318的高保真版本,一种更接近于图片真实感的版本。

      然后,合成引擎308可以在生成自图像帧316时用Avatar318(A)或Avatar318(B)叠加到对应于用户在环境中的位置。

      名为“Image capturing in extended reality environments”的高通专利申请最初在2021年2月提交,并在日前由美国专利商标局公布。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。