以下文章来源于望穹科技 ,作者望穹科技
是一家专门从事高科技信息咨询与服务的企业。针对测绘地理、导航时频、气象水文、国防科技、武器装备等领域的科技发展前沿,开展科技信息获取、处理、分析与服务。主要面向教学、科研、城市规划设计等部门和单位,特别是军事科研院所,提供高质量的服务。
了解如何管理和清理地理空间数据是任何分析战略的基本要素。
任何与数据打交道的人都会告诉你,数据并不完美。作者埃里·亚当斯(Eric Adams)作为一名职业生涯很长的地理空间专业人员,并且最近作为通用动力信息技术公司(GDIT)的地理空间功能专家和前美国地理空间工程师,他很赞同这种观点。干净的数据应该是一致的、相关的、有效的、最新的、统一的、完整的、罕见的。
GDIT 公司的Deepsky试验场允许团队与技术、行业和大学合作伙伴合作开发原型和解决方案。GDIT使用环境开发高性能计算、云和AI/ML中的新软件功能和解决方案,以支持地理空间任务。
这就是为什么了解如何管理和清理地理空间数据是任何分析策略的基本要素。有时候它也容易被忽视。了解与数据管理和清理相关的挑战——以及如何克服它们——是每个分析师都需要知道的,也是可操作的分析结果的基础。
那么,让我们来看看与地理空间数据相关的五个常见挑战,以及它们的解决方案:
不知道什么是“正确”
是的,存在“正确”和“错误”数据,有时分析师在开始一个项目时并不知道其中的区别。这就是标准和文档模板的用武之地。数据模式是非常重要的,它控制着数据应该如何表示以及如何解释。确保你在每个项目开始时都有一个这样的工具。
战场多源地理空间数据
无法编辑数据
在某些情况下,通常是出于安全目的,分析人员将没有适当的管理权限或获得这些权限所需的培训。在这种情况下,只有在对什么是“正确的”数据达成共识之后,分析人员才应该要求他们的管理员为他们提供适当的角色和权限来编辑和操作数据。
缺少源数据或元数据错误
有时源数据缺失,或者与之关联的元数据不好或不完整。在这些情况下,分析人员应该调查来源并执行研究来解决这个问题。只有当你对数据的来源有了完整的了解,你才能可靠地将其纳入你的分析中。
缺乏包含数据的工具
说白了,不是所有的数据库都是一样的。以一种安全、可访问和易于更新的方式存储数据非常重要。如果您发现自己没有足够的数据库工具或管理系统,请确保管理层提供资源或变通方法。
城市多源地理空间数据
清洁工具的质量参差不齐
就像数据库一样,不幸的是,不是所有的数据清理工具都是一样的。数据清理是一个循环的过程。分析师导入、合并、重建、标准化、规范化、删除重复数据、验证、充实和导出……然后在新的数据导入时再次开始。在每个阶段,都有一些工具可以提供帮助。例如,在ArcGIS中,有一些本地工具可以自动进行清理。请确保你使用的是高质量的工具,这些工具在信任和可靠性方面赢得了声誉。同样地,确保你正在跟踪清理的程序,因为这些程序经常被用于元数据和调查错误。
显然,数据管理和清理并非没有挑战。但是,在开始任何分析工作时,都要意识到这些挑战,并知道如何克服它们,这应该会给任何分析师带来成功所需的信心和保证。
荐读
《慧天地》敬告
《慧天地》公众号聚焦国内外时空信息科技前沿、行业发展动态、跨界融合趋势,发现企业核心竞争力,传播测绘地理信息文化,为相关专业学子提供日常学习、考研就业一站式服务,打造政产学研金服用精准对接的平台。
《慧天地》借鉴《读者》办刊理念,把时空信息领域的精华内容汇聚到平台上。我们高度重视版权,对于精选的每一篇推文,都会在文章开头显著注明出处,以表达对作者和推文引用平台版权的充分尊重和感谢;对于来源于网络作者不明的作品,转载时如出现侵权,请后台留言,我们会及时删除。感谢大家一直以来对《慧天地》的关注和支持!
——《慧天地》运营团队
投稿、转载、商务等合作请联系
微信号:huitiandi321
邮箱:geomaticshtd@163.com