博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Map2Shp软件字符编码解决方案——彻底杜绝Shape格式乱码
阅读量:6116 次
发布时间:2019-06-21

本文共 827 字,大约阅读时间需要 2 分钟。

在使用Shape文件时,如果里面有中文属性信息时,经常会遇到属性信息变为乱码。尤其是ArcGIS10.2.1之后,Esri改变了软件的默认字符编码规则,打开之前保存的Shapefile文件,总会不时遇到中文字符出现乱码现象。对此问题,网上好多建议是修改系统注册表或全局的字符编码设置,这样做固然有效,但这样会引起打开其它种类字符编码数据显示乱码的的问题;另外当我们拿到一个显示乱码的Shape数据,我们也很难猜出它本身是什么字符集的数据,使得乱码问题成为一个极其困扰的问题。

m2scode

为此,Map2Shp软件提供了专门的解决方案。转换结果输出时,可以选择Shape文件的字符编码(如图)。其中,ArcMap10.2及以前版本,中文字符默认采用ANSI编码,与操作系统默认编码格式一致,多为GBK编码方式,不会出现中文乱码,具有较广的通用性。ArcGIS10.2.1及之后版本,中文字符默认采用UTF-8编码,ArcGIS会先读取DBF头文件LDID中的编码,然后是cpg文件,最后是CodePage。Map2Shp输出UTF-8编码文件时,转换结果文件中增加一个.cpg文件,文件里面定义了dbf所使用的编码格式为UTF-8,ArcMap会读取.cpg文件来判断文件的编码,打开就不会有乱码。

ansi

总体上来说,Shape文件中文出现乱码的根本原因是读取文件使用的编码类型和文件实际存储的编码类型不一致所致,Map2Shp提供的解决方案中确保了编码信息的一致性,无论选用何种编码方式,在ArcGIS不同版本下均能够正确识别,彻底解决了中文乱码问题。

乱码

此外,由于shape文件自身限制,属性字段名称长度不能超过9个字节,而UTF-8 编码下单个汉字至少需要3个字节存储,因此UTF-8 编码下shape文件字段名称会被截断为最长3个汉字,而存在字段名称截断丢失现象。

utf8

转载于:https://www.cnblogs.com/map2shp/p/11018829.html

你可能感兴趣的文章
teamviewer 卸载干净
查看>>
多线程设计模式
查看>>
解读自定义UICollectionViewLayout--感动了我自己
查看>>
SqlServer作业指定目标服务器
查看>>
UnrealEngine4.5 BluePrint初始化中遇到编译警告的解决办法
查看>>
User implements HttpSessionBindingListener
查看>>
抽象工厂方法
查看>>
ubuntu apt-get 安装 lnmp
查看>>
焊盘 往同一个方向增加 固定的长度方法 总结
查看>>
eclipse的maven、Scala环境搭建
查看>>
架构师之路(一)- 什么是软件架构
查看>>
jquery的冒泡和默认行为
查看>>
USACO 土地购买
查看>>
【原创】远景能源面试--一面
查看>>
B1010.一元多项式求导(25)
查看>>
10、程序员和编译器之间的关系
查看>>
前端学习之正则表达式
查看>>
配置 RAILS FOR JRUBY1.7.4
查看>>
AndroidStudio中导入SlidingMenu报错解决方案
查看>>
修改GRUB2背景图片
查看>>