您现在的位置是:网站首页> 编程资料编程资料
python3里gbk编码的问题解决_python_
2023-05-26
343人已围观
简介 python3里gbk编码的问题解决_python_
在python3有关字符串的处理当中,经常会遇到
'gbk' codec can't encode character '\xa0'这个问题,原因是在str里面存在着不能正确编码的字符。
通过以下方法即可解决。
import requests from bs4 import BeautifulSoup url = "http://jecvay.com/2015/03/learning-compilers-1.html" url = url.encode('gbk','ignore').decode('utf-8') //忽略 response = requests.get(url) print(response) soup = BeautifulSoup(response.text) print(soup.body.text)以上方法在必须要记录数据的时候会出现数据不准确问题
python3 字符串无法将 gbk 完全转换为utf8
对于必须存储的情况,将gbk -> 十六进制字节码文本 保存,需要的时候在转换为gbk以便显示。
def string_hex(data): lin = ['%02X' % i for i in data] return "".join(lin).upper() def __ToUTF8(tuple): lists = [] for itme in tuple: tmp = itme if type(itme) == bytes: try: tmp = itme.decode('gbk') except UnicodeDecodeError: tmp = string_hex(itme) lists.append(tmp) return listsdef readFileAll(file): with open(file, 'rb') as f: data = f.read() return data
s = readFileAll('gkb.txt') //gbk 字符串文件 sx = string_hex(s)//转化为16进制文本 print(sx)到此这篇关于python3里gbk编码的问题解决的文章就介绍到这了,更多相关python3 gbk编码内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
您可能感兴趣的文章:
相关内容
- pytorch中.numpy()、.item()、.cpu()、.detach()以及.data的使用方法_python_
- python IO多路复用之epoll详解_python_
- 利用Python3编写一个电脑录屏神器_python_
- python FastApi实现数据表迁移流程详解_python_
- Python有关Unicode UTF-8 GBK编码问题详解_python_
- Python UnicodedecodeError编码问题解决方法汇总_python_
- python 实现syslog 服务器的详细过程_python_
- python中mpi4py的所有基础使用案例详解_python_
- conda虚拟环境使用pip下载包到当前环境的两种方法_python_
- 使用Pycharm创建一个Django项目的超详细图文教程_python_
