关于上交所show2003.DBF文件使用python读取问题

cjj208 发布于 2016/05/06 09:55
阅读 681
收藏 0

先上代码,实现一个从DBF文件中导入再转成pandas中的dataframe方式,读的时候出现了问题。

from simpledbf import Dbf5

import pandas as pd

dbf = Dbf5('Y:\show2003.dbf', codec='GBK')

df= pd.DataFrame(dbf.to_dataframe())#转成dataframe格式

报错UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 37: ordinal not in range(128)

结果打开dbf文件查看妈呀。什么鬼,第一行的格式似乎不对

那么碰到这个,我把第一行删掉就正常了,可是,问题是实时读取的时候,我应该如何先删掉第一行呢,或是在读的时候能否直接从第二行读取,,或是,可以解决那个报错的问题呢,,求大牛帮助

加载中
0
一碗粥
一碗粥
加个try: except:吧.
0
JerryLin
JerryLin
确定是GBK编码吗,看上去是utf8
0
cjj208
cjj208
是的,,我尝试了用了utf8但是读不出来,可以帮我看看吗?我可以把DBF文件发给你!!
JerryLin
JerryLin
第一行的编码可以用二进制工具看一下,也许数据是拼接的
0
JerryLin
JerryLin
实时数据,是3秒一次的那种包吗,哪里买的?
0
cjj208
cjj208
是实时的数据,才要用程序来删这一条,在哪买的就不方便在这说了,有兴趣可以一起研究一下,
JerryLin
JerryLin
看私信
0
cjj208
cjj208
如何写
返回顶部
顶部