请教问题，有没有大佬帮忙看看网页乱码问题

编程

更新时间：2024-09-1967

admin管理员组
文章数量:1516870

自我介绍：不是计算机专业，甚至不沾边。长期上网对网页制作什么的只有一丁点皮毛知识。有一些爬虫技能，但仅限于从网页获取json并解析，类似的。

使用设备：

设备名称   DESKTOP-53730H2
处理器   12th Gen Intel(R) Core(TM) i7-12700 2.10 GHz
机带 RAM   32.0 GB (31.3 GB 可用)
设备 ID   F9F3E092-CF01-4862-9DEC-00C1A4C39D78
产品 ID   00325-81388-30062-AAOEM
系统类型   64 位操作系统, 基于 x64 的处理器
笔和触控   没有可用于此显示器的笔或触控输入
版本   Windows 11 家庭版
版本   21H2
安装日期   ‎2022/‎5/‎11
操作系统版本   22000.2538
体验   Windows 功能体验包 1000.22001.1000.0

背景叙述：我本来打算爬取全国水雨情信息，发现我的电脑打开这个网页看到的json是一些生僻字，但是网页本身显示没问题，如下图。

解决一：

确认json存储格式为utf-8，ensure_ascii=False；存储的json依旧是乱码。

def get_tides (date):
    url = 'http://xxfb.mwr/OTMuhovshHolkdc/OTMbmdvbjQjosq'
    headers = {
        "Accept": "application/json, text/javascript, */*; q=0.01",
        "Content-Type": "application/json;charset=UTF-8",
        "Cookie": "__FT10000066=2024-3-16-13-46-27; __NRU10000066=1710567987611; __RT10000066=2024-3-16-13-46-27",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36 Edg/122.0.0.0",
        "X-Requested-With": "XMLHttpRequest",
    }
    retries = 0
    while retries < 5:
        try:
            r = requests.post(url, headers=headers)
            r.raise_for_status()
            data = r.json()
            with open(f"{date.strftime('%Y-%m-%d')}.json", "w", encoding="utf-8") as f:
                json.dump(data, f, ensure_ascii=False)
            break
        except (requests.exceptions.RequestException, json.JSONDecodeError) as e:
            retries += 1
            print(e)

get_tides(datetime.now())
font_file_uel = 'http://xxfb.mwr/ttf/aLVP5AhmbQ_1710586649773.eot?#iefix'
ttf = TTFont(io.BytesIO(requests.get(font_file_uel).content))
# ttf.save('sqsj.ttf')
ttf.saveXML('sqsj.xml')

于是天真的我以为这个网页被反爬了，就开始找字体库，并准备解析这个字体库，然后把json还原。后来进行到准备写字典，查看 ttf 的时候发现字太多了，根本统计不完，遂作罢。

解决二：

找了一个爬虫的老师帮我写爬虫代码，老师把代码给我后，我一看很简单，就是获取json然后解析，于是运行了。运行后发现得到的excel文件里的信息还是乱码。但是老师说他那边的文件是对的，他的网站打开也是对的。

老师获取的数据和网页截图：

所以我就很纳闷。。

解决三：

以为是自己访问过于频繁被限IP了，就远程了同学的电脑，同学跟我不在一个城市，用她的电脑查看了这个网页全国水雨情信息，发现同学的电脑看到的json也全是生僻字。

解决四：

以为是我电脑字体的问题，就修改了电脑--控制--时钟和区域--管理--更改系统区域设置--Beta版打勾--确认，发现没用。

我开始了漫长的找原因之旅。。

1）用IE模式打开了原网站，发现整个网页的主要内容全是乱码；

2）修改了网页编码为UTF-8，依旧是乱码；

3）确认了网页和json的编码格式的确是 UTF-8；

所以到底是为什么。。

我开始查资料，觉得是网页制作的bug。。但我毕竟不是专业的。。所以有没有大神能帮我看看这究竟是怎么回事

疑惑的点：

1. 为什么老师的浏览器可以看到完美的网页，而我下载的json全是乱码？

2. 我的操作过程有任何问题或者多余，都请老师们指出，我全都欣然接受，太想学习，太想知道了！

本文标签：大佬乱码网页

版权声明：本文标题：请教问题，有没有大佬帮忙看看网页乱码问题内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.betaflare.com/biancheng/1726724070a1154991.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

编程频道|软件玩家 - 软件改变生活！

请教问题，有没有大佬帮忙看看网页乱码问题

背景叙述：我本来打算爬取全国水雨情信息，发现我的电脑打开这个网页看到的json是一些生僻字，但是网页本身显示没问题，如下图。

更多相关文章

解决kali渗透win7后shell命令乱码

英文版WIN7系统中打开软件中文乱码解决办法

电脑问答：排解网页无法显示问题

网页死机问题解决方案

网页字体变小了怎么办？解决方法详解

网页打不开的原因分析与解决方案

如何打开Prompt ASPX文件：详细操作指南

电脑问答：字体库、关键词与网页排版的深度探索

网页部分无法打开的原因分析与排查指南

电脑设置动态壁纸的详细指南

鼠标右键失灵解决方案详解

网页部分打不开的原因与解决方案解析

网页打不开、关键词分析与解决方案 — 电脑问答详解

网页字体变小时的解决方案：提升浏览体验的详细指南

网页字体变小时的解决策略与深入分析

解决网页无法打开的全面指南

PDF文件打开乱码解决方案：深度剖析与操作指南

网页视频下载指南：关键词生成技巧与操作流程

电脑答疑：解决prompt打不开问题的深入解析

深入探讨网页无法访问的各类原因并给出具体操作步骤

发表评论

推荐文章

破解微信小程序 Cookie 登陆难题：错误在于哪里？

Flash中心的神秘顽固文件夹，怎么删都删不掉？这里有答案！

“一招搞定：让你的隐藏文件不再神秘”

Adobe Flash Player的HKSS网络故障：BCMWltry.exe的解决方案

手机操作TP-LINK路由器，从此上网无忧！

热门文章

百与十的舞蹈：整数换装记

Microsoft Edge、Chrome等浏览器如何精确定位并清除某个网站缓存

笔记本电脑新手指南：如何无缝连接蓝牙耳机

家庭网络新手必学：路由器设置步骤详解

只需几步，让你的电脑在设定时间后自动熄屏：2小时40分钟关机教程！

游历西藏：体验Adobe Flash Player背后的文化与创新

Pagefile.sys：操作系统中的虚拟内存，你该不该删掉它？

Windows 7 IE临时文件夹在哪？手把手教你快速定位

全面解读开机自启动：设置技巧与命令代码详解

街头篮球高手养成记：键盘布局与灵敏度调整，一招秒杀全场

最新文章

金融建模中Excel与VBA的超级组合拳

现代计算的新篇章：把FEMCFD求解器封装为PyTorch或JAX函数

突破视觉强化学习训练的‘视觉’障碍，MJX带来高效方案

Excel高手必备：TL431可调电压基准源的求解秘技

高性能物理世界：MuJoCo XLA在Unity中的应用揭秘

Excel宏数量爆炸，开机慢如乌龟？轻松破解攻略！

Open-AutoGLM性能瓶颈大揭秘：破解编译三大障碍

MuJoCo高手之路：从入门到精通的进阶指南

深度学习加速新纪元：张量引擎TBE与深度学习编译器，加速你的训练与推理

MJX秘籍：5倍加速技巧，改写强化学习训练规则！

清华同方超锐L60P 龙芯 3A600032GB1TB集显麒麟统信永久版系统参数报价

清华同方超锐L60P 龙芯 3A600016GB512GB集显KOS麒麟系统试用版参数报价

清华同方超锐L60P 龙芯 3A600032GB1TB集显麒麟统信永久版系统+WPS参数报价

清华同方超锐L60P 龙芯 3A600016GB512GB集显麒麟统信永久版系统参数报价

联想开天X1f G1d 飞腾D3000M16GB1TB集显国防版麒麟统信系统参数报价