当前位置: 首页 > news >正文

Flask+Gunicorn中文乱码解决方案

在使用Flask+Gunicorn部署应用时,发现中文的输出存在乱码的现象。这是因为Python的默认编码是ASCII,而ASCII并不支持中文字符。

解决Python中文乱码问题的首要任务是确保使用合适的编码方式。当你处理中文字符时,应该使用UTF-8编码。UTF-8是一种支持多种字符集的编码方式,包括中文字符。

一、关于编码的背景知识

首先我们来谈一谈编码这个东西,由于计算机是美国人发明的,最早的编码里面仅仅有数字字母以及一些符号,不包含中文汉字,这个编码表我们常称为ASCII码表。

而要处理中文的时候,原来的ASCII码表就不够用了,需要使用两个字节来保存一个汉字,于是中国制定了GB2312编码,不会与原来的ASCII码表冲突,又可以用来表示中文汉字。但中国会把汉字弄成GB2312编码(也可以叫GBK编码),其他国家比如韩国会把韩文弄一个编码集,日本会弄一个日文编码集,因此在多语种文本中,这样的编码就势必会造成编码冲突,显示出来的时候,呈现出所谓的乱码。

因此,Unicode编码诞生了,这种编码可以把所有的语言都放到一种编码之中,这样就不会有乱码出现了。默认来讲,Unicode编码占用2个字节(一些偏僻文字可能占用4个),Ascii码占用一个字节。如果都用Unicode编码来写文件,那乱码肯定消失了,但你会发现,如果你的文件绝大多数文字都是一些ascii码可以覆盖的内容的话,使用Unicode的编码就会极大的占用空间了。

因此,又发明了可变长编码“UTF8”(或utf-8)。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。

大概的知识就是这样,因此我们总结出了现在常见的ASCII,Unicode,utf-8三种编码。

由于python比unicode的诞生还要早,因此最早的python只支持ascii码,而后来的版本python加入了unicode的支持。

二、解决中文乱码

具体可以通过以下几种方案来解决。

方法1:在app.config中设置编码

创建app示例时,设置对应的编码格式为UTF-8,代码如下:

app = Flask(__name__)
app.config['JSON_AS_ASCII'] = False
app.config['JSONIFY_MIMETYPE'] = 'application/json;charset=UTF-8'

Flask在创建app时,默认开启ASCII编码模式,可以通过 app.config['JSON_AS_ASCII'] = False 关闭ASCII编码模式。

  • 在比较新的版本的Flask中,app.config['JSON_AS_ASCII'] = False 已经被弃用,更改为app.json.ensure_ascii = False
  • 如果在Flask中有使用jsonify来生成response,可以使用 app.config['JSONIFY_MIMETYPE'] = 'application/json;charset=UTF-8'
from flask import Flask, jsonifyapp = Flask(__name__)
app.config['JSON_AS_ASCII'] = False
app.config['JSONIFY_MIMETYPE'] = 'application/json;charset=UTF-8'students = [{"id": 1, "name": '李红'},{"id": 2, "name": '张明'}
]@app.route('/students/list')
def students_list():return jsonify(students)if __name__ == '__main__':app.run()

方法2:设置response的编码格式

from flask import Flask, jsonify, request, make_responseapp = Flask(__name)@app.route('/students/list')
def students_list():data = get_students_list()res_data = {'code': 200,'data': data,'message': 'success'}response = make_response(jsonify(res_data))response.headers['Content-Type'] = 'application/json;charset=UTF-8'return response

方法3:设置Python解释器的编码环境

如果上面的方法都不适用,可以查看下系统的python版本。我在开发环境的python 3环境中是正常显示的,但是到了生产环境(CentOS 7.9,python 2.7)中便出现乱码现象。

这是因为对于python 2.7来说,默认的编码不支持中文。可以通过设置Python解释器的编码环境变量来全局解决中文乱码问题。

由于我这里使用了docker进行部署,所以只需要在Dockerfile中加上如下语句:

ENV PYTHONIOENCODING=UTF-8

参考资料

  • python接口使用flask_jsonify后响应unicode编码改UTF-8编码
  • 解决Python中文乱码问题的策略与技巧
http://www.lryc.cn/news/308755.html

相关文章:

  • vue3的开发小技巧
  • 十三、Qt多线程与线程安全
  • 今日话题:---自卑
  • Unity 预制体与变体
  • leetcode:860.柠檬水找零
  • Python程序的流程
  • C语言可以干些什么?C语言主要涉及哪些IT领域?
  • element-ui附件上传及在线查看详细总结,后续赋源码
  • 投标中excel表格常用功能梳理
  • C++二叉搜树的实现(递归和非递归)
  • 蓝桥杯算法 一.
  • 如何学习自然语言处理之语言模型
  • Zoho ToDo 满足您的需求:任务管理满足隐私和安全要求
  • 仿牛客网项目---社区首页的开发实现
  • 虚拟机部署Sentry步骤,国内地址
  • [Android View] 可绘制形状 (Shape Xml)
  • [游戏开发][虚幻5]新建项目注意事项
  • 防考试作弊切屏
  • 浅析能耗监测系统在大型数据中心的应用
  • robotframework-去除字符串左侧的0的方法
  • 【Linux C | 网络编程】getaddrinfo 函数详解及C语言例子
  • 深度学习主流开源框架:Caffe、TensorFlow、Pytorch、Theano、Keras、MXNet、Chainer
  • [Linux] vim及gdb的使用
  • Android WebView访问网页+自动播放视频+自动全屏+切换横屏
  • php PhpSpreadsheet 读取日期变数字问题解决
  • 前端架构: 脚手架包管理工具之lerna的全流程开发教程
  • [安洵杯 2019]easy_serialize_php1
  • 【前端素材】推荐优质在线通用果蔬商城电商网页eStore平台模板(附源码)
  • 开源软件的商业模式探析:开放与盈利的平衡
  • 使用全局事件总线实现任意组件间的通讯