从理论到实践：一揽子5777张路面积水分割数据集，YOLO道路积水检测算法实战教程-软件玩家

admin管理员组
文章数量:1516870

文章前瞻：优质数据集与检测系统精选

点击链接：

数据集与检测系统	数据集与检测系统

一、数据集介绍

【数据集】路面积水分割数据集 5777 张 ，目标检测， 包含COCO的json格式、Labelme的json格式、yolo的txt格式标注 。

数据集中包含 1 种分类 ，具体分类为：names = ['puddle']，对应 ['路面积水']。

数据集图片来自国内外网站、网络爬虫等；

可用于 路面积水分割识别 。

检测场景为 城区道路、乡镇道路、园区、工厂等 ，可以应用于 交通动态管控、市政排水调度，行人安全保障，内涝隐患排查 等。

文章底部名片或主页私信获取数据集~

1、数据概述

路面积水分割识别的重要性

路面积水是雨天及城市内涝高发期的典型隐患：轻则导致车辆打滑（雨天积水路段刹车距离显著增加）、行人滑倒，重则引发车辆熄火、道路塌陷，甚至因积水掩盖窨井、坑洼造成致命事故，多数城市雨天道路事故中，有相当比例与路面积水直接相关。

传统路面积水检测存在明显短板：人工巡查受雨天视野、安全条件限制，单名巡检员日均覆盖路段有限，漏检情况较多；固定水位传感器仅能监测特定点位，无法覆盖全域路面，且难以有效区分 “积水区域” 与 “潮湿路面”。

YOLO 算法通过 “实时分割 + 精准定位” 破解上述痛点：其一，依托城市道路监控摄像头，可实现高帧率实时检测，对积水区域的分割准确率较高，能快速区分明显积水与普通潮湿路面；其二，可同步输出积水位置（精确到车道）、面积及估算深度，无需额外大规模布设传感器，显著降低覆盖成本；其三，检测延迟极短，能在积水刚形成时触发预警，避免隐患扩大，为道路安全与城市内涝防控提供关键技术支撑。

基于YOLO的道路积水分割算法

交通动态管控：YOLO 实时识别积水路段后，联动交通诱导屏推送 “积水预警 + 绕行建议”，并通知交管部门临时限流，应用后雨天积水路段交通事故率明显下降，通行效率得到有效提升。
市政排水调度：根据 YOLO 输出的积水位置、面积及深度数据，系统自动匹配就近排水泵站，调节抽排功率，优先处理主干道、下穿隧道等关键区域积水，试点区域内涝消退时间大幅缩短。
行人安全保障：在人行道、学校门口等区域，YOLO 检测到积水后，触发路边声光提醒（如 “前方积水，注意绕行”），并通过城市 APP 推送至周边行人，显著减少滑倒事故，相关投诉量大幅降低。
内涝隐患排查：通过 YOLO 长期积累的积水数据，可分析高频积水点（如低洼路段、排水口堵塞区域），指导市政部门针对性改造（如垫高路面、扩容排水管道），从源头减少积水隐患，城区高频积水点数量明显减少。

该数据集含有 5777 张图片， Labelme 的 JSON 格式、 COCO JSON 格式、 YOLO 的 txt 格式，用于训练和测试 城区道路、乡镇道路、园区、工厂等场景进行道路积水检测 。

图片格式为jpg格式，标注格式分别为：

coco：Json

labelme：Json

YOLO：TXT

数据集为 labelme 标注，保证标注精确度。

2、数据集文件结构

puddle_seg /
——test/
————Annotations/
————images/
————labels/
————test_coco.json
——train/
————Annotations/
————images/
————labels/
————train_coco.json
——valid/
————Annotations/
————images/
————labels/
————valid_coco.json
——data.yaml

该数据集已划分训练集样本，分别是： test 目录（测试集）、 train 目录（训练集）、 valid 目录（验证集）；
Annotations文件夹为 TXT格式 的标注文件
images文件夹为 jpg格式 的数据样本；
labels文件夹是 labelme格式 的 JSON文件；(txt格式可通过脚本转换，yolo分割模型需要txt格式)
coco.json是coco格式的分割标注文件
data.yaml是数据集配置文件，包含 道路积水识别 的目标分类和加载路径。

json格式的标注文件 内容如下：

{
  "version": "5.8.1",
  "flags": {},
  "shapes": [
    {
      "label": "puddle",
      "points": [
        [
          2.5,
          0.0
        ],
        [
          0.0,
          450.0
        ],
        [
          30.0,
          485.0
        ],
        [
          77.5,
          512.5
        ],
        [
          132.5,
          532.5
        ],
        [
          337.5,
          637.5
        ],
        [
          637.5,
          635.0
        ],
        [
          637.5,
          0.0
        ],
        [
          2.5,
          0.0
        ]
      ],
      "group_id": null,
      "description": null,
      "shape_type": "polygon",
      "flags": {},
      "mask": null
    }
  ],
  "imagePath": "image31_jpeg_jpg.rf.1dd36f1ed8aa32142cf4e720d5bee895.jpg",
  "imageData": null,
  "imageHeight": 640,
  "imageWidth": 640
}

3、数据集适用范围

实例分割识别 场景， 监控摄像头识别，无人机识别
yolo训练模型或其他模型
城区道路、乡镇道路、园区、工厂等场景
可以用于 交通动态管控、市政排水调度，行人安全保障，内涝隐患排查 等。

4、数据集标注结果

4.1、数据集内容

多角度场景： 监控摄像头 视角，行人视角；
标注内容： 1个分类；
图片总量： 5777 张图片数据；
标注类型： labelme Json 格式、 coco Json 格式、 YOLO txt 格式；

5、训练过程

5.1、数据标注文件格式转换（如果需要json转txt）

新建json2Txt.py文件，将数据集的标签名称以及输入输出路径在main函数里修改，转换之后的txt文件作文模型的训练标签文件。

import json
import os
from pathlib import Path
def labelme_to_yolo(json_path, output_dir, class_list):
    """
    将LabelMe的JSON文件转换为YOLO格式的TXT文件
    参数:
        json_path: LabelMe JSON文件路径
        output_dir: 输出目录路径
        class_list: 类别名称列表
    """
    # 确保输出目录存在
    Path(output_dir).mkdir(parents=True, exist_ok=True)
    # 读取JSON文件
    with open(json_path, 'r', encoding='utf-8') as f:
        data = json.load(f)
    # 获取图像尺寸
    img_width = data['imageWidth']
    img_height = data['imageHeight']
    # 准备输出TXT文件路径
    txt_filename = Path(json_path).stem + '.txt'
    txt_path = os.path.join(output_dir, txt_filename)
    with open(txt_path, 'w', encoding='utf-8') as f:
        for shape in data['shapes']:
            # 获取类别名称和索引
            label = shape['label']
            class_index = class_list.index(label)
            # 获取多边形或矩形点
            points = shape['points']
            # 处理不同形状
            if shape['shape_type'] == 'rectangle':
                # 矩形转换为YOLO格式 (x_center, y_center, width, height)
                x_min = min(points[0][0], points[1][0])
                x_max = max(points[0][0], points[1][0])
                y_min = min(points[0][1], points[1][1])
                y_max = max(points[0][1], points[1][1])
                x_center = (x_min + x_max) / 2 / img_width
                y_center = (y_min + y_max) / 2 / img_height
                width = (x_max - x_min) / img_width
                height = (y_max - y_min) / img_height
                f.write(f"{class_index} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}\n")
            elif shape['shape_type'] == 'polygon':
                # 多边形转换为YOLO格式 (class_index x1 y1 x2 y2 ...)
                normalized_points = []
                for point in points:
                    normalized_x = point[0] / img_width
                    normalized_y = point[1] / img_height
                    normalized_points.extend([normalized_x, normalized_y])
                points_str = ' '.join([f"{p:.6f}" for p in normalized_points])
                f.write(f"{class_index} {points_str}\n")
            elif shape['shape_type'] == 'circle':
                # 圆转换为YOLO格式 (近似为矩形)
                center_x, center_y = points[0]
                radius_x = abs(points[1][0] - center_x)
                radius_y = abs(points[1][1] - center_y)
                x_min = (center_x - radius_x) / img_width
                y_min = (center_y - radius_y) / img_height
                x_max = (center_x + radius_x) / img_width
                y_max = (center_y + radius_y) / img_height
                x_center = (x_min + x_max) / 2
                y_center = (y_min + y_max) / 2
                width = x_max - x_min
                height = y_max - y_min
                f.write(f"{class_index} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}\n")
def batch_convert_labelme_to_yolo(json_dir, output_dir, class_list):
    """
    批量转换LabelMe JSON文件为YOLO格式
    参数:
        json_dir: 包含LabelMe JSON文件的目录
        output_dir: 输出目录路径
        class_list: 类别名称列表
    """
    json_files = [f for f in os.listdir(json_dir) if f.endswith('.json')]
    for json_file in json_files:
        json_path = os.path.join(json_dir, json_file)
        labelme_to_yolo(json_path, output_dir, class_list)
    print(f"转换完成! 共转换了 {len(json_files)} 个文件。")
if __name__ == '__main__':
    # 示例用法
    JSON_DIR = 'test/labels'  # LabelMe JSON文件所在目录
    OUTPUT_DIR = 'test/txt'  # 输出TXT文件目录
    CLASS_LIST = ['puddle']  # 类别列表，顺序对应YOLO的类别索引
    batch_convert_labelme_to_yolo(JSON_DIR, OUTPUT_DIR, CLASS_LIST)

5.2、导入训练数据

下载项目压缩包，解压在任意本地workspace文件夹中。

下载，导入到 ultralytics-main 项目根目录下。

在 ultralytics-main 项目根目录下，创建data文件夹，并在data文件夹下创建子文件夹： images、labels， 其中，将 YOLO格式的TXT文件 手动导入到Annotations文件夹中，将 JPG格式的图像数据 导入到images文件夹中。

（注：数据集文件包中train、test、valid三个文件夹的images和labels合并）

data目录结构如下：

5.3、数据划分

首先在ultralytics-main目录下创建一个split.py文件，运行文件之后会在ultralytics-main目录下生成datasets文件夹，具体目录如下：

训练集、验证集、测试集已经完成划分。

import shutil
import random
import os
# 原始路径
image_original_path = "data/images/"
label_original_path = "data/labels/"
# 数据集划分比例（可以自定义）
train_percent = 0.8
val_percent = 0.1
test_percent = 0.1
cur_path = os.getcwd()
# 训练集路径
train_image_path = os.path.join(cur_path, "datasets/images/train/")
train_label_path = os.path.join(cur_path, "datasets/labels/train/")
# 验证集路径
val_image_path = os.path.join(cur_path, "datasets/images/val/")
val_label_path = os.path.join(cur_path, "datasets/labels/val/")
# 测试集路径
test_image_path = os.path.join(cur_path, "datasets/images/test/")
test_label_path = os.path.join(cur_path, "datasets/labels/test/")
# 训练集目录
list_train = os.path.join(cur_path, "datasets/train.txt")
list_val = os.path.join(cur_path, "datasets/val.txt")
list_test = os.path.join(cur_path, "datasets/test.txt")
def del_file(path):
    for i in os.listdir(path):
        file_data = path + "\\" + i
        os.remove(file_data)
def mkdir():
    if not os.path.exists(train_image_path):
        os.makedirs(train_image_path)
    else:
        del_file(train_image_path)
    if not os.path.exists(train_label_path):
        os.makedirs(train_label_path)
    else:
        del_file(train_label_path)
    if not os.path.exists(val_image_path):
        os.makedirs(val_image_path)
    else:
        del_file(val_image_path)
    if not os.path.exists(val_label_path):
        os.makedirs(val_label_path)
    else:
        del_file(val_label_path)
    if not os.path.exists(test_image_path):
        os.makedirs(test_image_path)
    else:
        del_file(test_image_path)
    if not os.path.exists(test_label_path):
        os.makedirs(test_label_path)
    else:
        del_file(test_label_path)
def clearfile():
    if os.path.exists(list_train):
        os.remove(list_train)
    if os.path.exists(list_val):
        os.remove(list_val)
    if os.path.exists(list_test):
        os.remove(list_test)
def main():
    mkdir()
    clearfile()
    file_train = open(list_train, 'w')
    file_val = open(list_val, 'w')
    file_test = open(list_test, 'w')
    total_txt = os.listdir(label_original_path)
    num_txt = len(total_txt)
    list_all_txt = range(num_txt)
    num_train = int(num_txt * train_percent)
    num_val = int(num_txt * val_percent)
    num_test = num_txt - num_train - num_val
    train = random.sample(list_all_txt, num_train)
    # train从list_all_txt取出num_train个元素
    # 所以list_all_txt列表只剩下了这些元素
    val_test = [i for i in list_all_txt if not i in train]
    # 再从val_test取出num_val个元素，val_test剩下的元素就是test
    val = random.sample(val_test, num_val)
    print("训练集：{}, 验证集：{}, 测试集：{}".format(len(train), len(val), len(val_test) - len(val)))
    for i in list_all_txt:
        name = total_txt[i][:-4]
        srcImage = image_original_path + name + '.jpg'
        srcLabel = label_original_path + name + ".txt"
        if i in train:
            dst_train_Image = train_image_path + name + '.jpg'
            dst_train_Label = train_label_path + name + '.txt'
            shutil.copyfile(srcImage, dst_train_Image)
            shutil.copyfile(srcLabel, dst_train_Label)
            file_train.write(dst_train_Image + '\n')
        elif i in val:
            dst_val_Image = val_image_path + name + '.jpg'
            dst_val_Label = val_label_path + name + '.txt'
            shutil.copyfile(srcImage, dst_val_Image)
            shutil.copyfile(srcLabel, dst_val_Label)
            file_val.write(dst_val_Image + '\n')
        else:
            dst_test_Image = test_image_path + name + '.jpg'
            dst_test_Label = test_label_path + name + '.txt'
            shutil.copyfile(srcImage, dst_test_Image)
            shutil.copyfile(srcLabel, dst_test_Label)
            file_test.write(dst_test_Image + '\n')
    file_train.close()
    file_val.close()
    file_test.close()
if __name__ == "__main__":
    main()

5.4、修改数据集配置文件

在ultralytics-main目录下创建一个data.yaml文件

path: ../datasets/images
train: train  # 数据集路径下的train
val: val  # 数据集路径下的val
test: test  # 数据集路径下的test
# 标签个数
nc: 1
# Classes标签名称
names: ['puddle']

5.5、执行命令

在ultralytics-main目录下创建一个train.py文件，运行

from ultralytics import YOLO
if __name__ == '__main__':
    model = YOLO("yolo11s-seg.pt")
    model.train(data=r'data.yaml',
                imgsz=640,
                epochs=100,
                batch=16,
                workers=0,
                device='0'
                )

也可以在终端执行下述命令：

yolo segment train data=data.yaml model=yolo11s-seg.pt epochs=200 imgsz=640 batch=16 workers=0 device=0

5.6、模型预测

在ultralytics-main目录下创建一个test_pic文件夹，导入测试集图片，在ultralytics-main目录下新建predict.py预测脚本文件，运行后会在 run/segment/predict 文件夹下生成推理图片。

代码如下：

import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLO
if __name__ == '__main__':
    model = YOLO('runs/segment/train/weights/best.pt')
    model.predict(source='test_pic',
                  imgsz=640,
                  device='0',
                  save=True
                  )

6、获取数据集

文章底部名片或主页私信获取数据集~

——————————————————————————

更多数据集请查看

本文标签：目录系统编程

版权声明：本文标题：从理论到实践：一揽子5777张路面积水分割数据集，YOLO道路积水检测算法实战教程内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.betaflare.com/biancheng/1772567723a3275248.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

编程频道|软件玩家 - 软件改变生活！

从理论到实践：一揽子5777张路面积水分割数据集，YOLO道路积水检测算法实战教程

文章前瞻：优质数据集与检测系统精选

一、数据集介绍

1、数据概述

2、数据集文件结构

3、数据集适用范围

4、数据集标注结果

4.1、数据集内容

5、训练过程

5.1、数据标注文件格式转换（如果需要json转txt）

5.2、导入训练数据

5.3、数据划分

5.4、修改数据集配置文件

5.5、执行命令

5.6、模型预测

6、获取数据集

更多相关文章

Office 2016简体中文官方正版镜像，一步到位的授权安装

免费Office 2016安装指南，让你工作学习更高效

正版Office2016大集结，Microsoft Office Professional Plus 2016完整版，CD原装复制！

告别安装难题，64位Office 2016及Project 2016一站式解决方案

IE管理员权限设置指南，让SWF文件流畅播放！

从Adobe Flash Player到新浏览器，快速解除默认状态！

搞定Win下的默认浏览器：为何总是IE_Web当道？

让IE浏览器成为你的默认选择：操作指南

别让浏览器选你，用批处理快速设置IE为默认

摆脱电脑束缚，用手机轻松管理TP-LINK路由器

手机操作TP-LINK路由器，从此上网无忧！

SWF解禁利器：让你的Flash中心火力全开，网速飙升

电脑网速大提速，告别卡顿，瞬间流畅！

在Win10下迷路的QoS数据包调度工具？轻松破解网速限制的方法！

网速慢到离谱？5分钟内手动优化，让你瞬间畅享高速

Win11网络权限大升级：解除网络限制的轻松攻略

从零开始：掌握在Windows系统中部署LOCAL SOLVER并实现首个优化案例

C++高手进阶：探索创建Excel插件的神秘领域

从SWF到TPU V4：科技演变中的十年磨一剑

MuJoCo高手之路：从入门到精通的进阶指南

发表评论

推荐文章

一键搞定：电脑截图技巧大全，再也不用怕捉襟见肘

启动磁盘检查工具来拯救丢失的文件

提升电脑性能：解析并管理pagefile.sys和_hiberfil.sys

转换大揭秘：FAT32转NTFS，让硬盘发挥最大效能

开机第一步到桌面：电脑启动的秘密之旅

热门文章

Vista激活失败代码0X80072EFE，快速修复指南！

乱码、停止工作？轻松解决你的League of Legends安装难题！

面对Ansible 2.9.18中DNF更新挑战，教你如何配置使得ansible-playbook包能自动使用dnf

当你的电脑报告MSVCPUC110.dll丢失，怎么办？实用方案解析！

Python编写梦幻西游助手：告别繁琐任务，轻松游戏

BCMwTry.exe与HKSS网络中的Adobe Flash Player障碍：如何克服？

轻松搞定Android中文书名号与字符串，还有那些被忽略的高亮功能

持续升级你的Android应用：实现自动更新功能

Office 2016 简体中文批量授权版镜像，官方正版资源，轻松获取！

告别Win10网速瓶颈，流畅体验从这开始！

最新文章

金融建模中Excel与VBA的超级组合拳

现代计算的新篇章：把FEMCFD求解器封装为PyTorch或JAX函数

突破视觉强化学习训练的‘视觉’障碍，MJX带来高效方案

Excel高手必备：TL431可调电压基准源的求解秘技

高性能物理世界：MuJoCo XLA在Unity中的应用揭秘

Excel宏数量爆炸，开机慢如乌龟？轻松破解攻略！

Open-AutoGLM性能瓶颈大揭秘：破解编译三大障碍

MuJoCo高手之路：从入门到精通的进阶指南

深度学习加速新纪元：张量引擎TBE与深度学习编译器，加速你的训练与推理

MJX秘籍：5倍加速技巧，改写强化学习训练规则！

清华同方超锐L60P 龙芯 3A600032GB1TB集显麒麟统信永久版系统参数报价

清华同方超锐L60P 龙芯 3A600016GB512GB集显KOS麒麟系统试用版参数报价

清华同方超锐L60P 龙芯 3A600032GB1TB集显麒麟统信永久版系统+WPS参数报价

清华同方超锐L60P 龙芯 3A600016GB512GB集显麒麟统信永久版系统参数报价

联想开天X1f G1d 飞腾D3000M16GB1TB集显国防版麒麟统信系统参数报价