当前位置：首页 > news >正文

无人机正摄影像自动识别与矢量提取系统

news 2025/7/25 12:05:47

无人机正摄影像自动识别与矢量提取系统

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。

1. 项目概述

本项目旨在开发一个基于Python的自动化系统，能够从TIFF格式的无人机正摄影像中识别并提取多种地物要素，包括水边线、道路、桥梁、植被图斑、房屋、趸船和护岸。系统将采用深度学习与计算机视觉技术相结合的方法，实现高精度（95%以上）的自动识别，并将结果以带有相同坐标信息的矢量DWG/DXF格式保存。

2. 系统架构设计

2.1 总体架构

系统采用模块化设计，主要包含以下核心模块：

影像预处理模块：负责TIFF影像的读取、坐标系统转换和增强处理
特征识别模块：基于深度学习的多类别地物识别
后处理模块：优化识别结果，减少误识别
矢量转换模块：将识别结果转换为DWG/DXF格式
精度评估模块：验证识别结果的准确性

2.2 技术路线

TIFF影像输入 → 预处理 → 深度学习识别 → 后处理优化 → 矢量转换 → DWG/DXF输出

3. 详细实现

3.1 环境配置与依赖库

# 环境要求
"""
Python 3.8+
GDAL 3.0+
TensorFlow 2.4+ 或 PyTorch 1.8+
OpenCV 4.2+
scikit-image
scikit-learn
numpy
matplotlib
ezdxf (用于DXF输出)
pyautocad 或 python-docx (可选，用于DWG输出)
"""

3.2 影像预处理模块

import gdal
import numpy as np
import cv2
from skimage import exposureclass ImagePreprocessor:def __init__(self, tiff_path):"""初始化预处理类，读取TIFF文件"""self.dataset = gdal.Open(tiff_path)if self.dataset is None:raise ValueError("无法打开TIFF文件")# 获取地理参考信息self.geotransform = self.dataset.GetGeoTransform()self.projection = self.dataset.GetProjection()# 读取图像数据self.bands = []for i in range(self.dataset.RasterCount):band = self.dataset.GetRasterBand(i+1)self.bands.append(band.ReadAsArray())self.height, self.width = self.bands[0].shapedef get_geo_info(self):"""返回地理参考信息"""return self.geotransform, self.projectiondef normalize_image(self):"""影像归一化处理"""normalized = []for band in self.bands:# 对比度拉伸band = exposure.rescale_intensity(band, in_range=(0, 255))# 归一化到0-1band = band.astype(np.float32) / 255.0normalized.append(band)return np.stack(normalized, axis=-1)def enhance_image(self):"""影像增强处理"""# 使用多光谱信息进行增强if len(self.bands) >= 3:rgb = np.stack(self.bands[:3], axis=-1)# 直方图均衡化lab = cv2.cvtColor(rgb, cv2.COLOR_RGB2LAB)l, a, b = cv2.split(lab)clahe = cv2.createCLAHE(clipLimit=3.0, tileGridSize=(8,8))l = clahe.apply((l*255).astype(np.uint8))lab = cv2.merge((l, a, b))enhanced = cv2.cvtColor(lab, cv2.COLOR_LAB2RGB)return enhancedelse:return self.normalize_image()def get_patch(self, x, y, size=512):"""获取指定位置的图像块"""half_size = size // 2x_start = max(0, x - half_size)y_start = max(0, y - half_size)x_end = min(self.width, x + half_size)y_end = min(self.height, y + half_size)patch = []for band in self.bands:patch.append(band[y_start:y_end, x_start:x_end])return np.stack(patch, axis=-1)

3.3 深度学习识别模块

import tensorflow as tf
from tensorflow.keras import layers, modelsclass FeatureExtractor:def __init__(self, model_path=None):"""初始化特征提取模型"""if model_path:self.model = tf.keras.models.load_model(model_path)else:self.model = self.build_default_model()def build_default_model(self):"""构建默认的UNet分割模型"""inputs = tf.keras.Input(shape=(512, 512, 3))# 下采样路径x = layers.Conv2D(64, 3, activation='relu', padding='same')(inputs)x = layers.Conv2D(64, 3, activation='relu', padding='same')(x)x = layers.MaxPooling2D(2)(x)x = layers.Conv2D(128, 3, activation='relu', padding='same')(x)x = layers.Conv2D(128, 3, activation='relu', padding='same')(x)x = layers.MaxPooling2D(2)(x)x = layers.Conv2D(256, 3, activation='relu', padding='same')(x)x = layers.Conv2D(256, 3, activation='relu', padding='same')(x)x = layers.MaxPooling2D(2)(x)# 上采样路径x = layers.Conv2DTranspose(128, 3, strides=2, activation='relu', padding='same')(x)x = layers.Conv2D(128, 3, activation='relu', padding='same')(x)x = layers.Conv2DTranspose(64, 3, strides=2, activation='relu', padding='same')(x)x = layers.Conv2D(64, 3, activation='relu', padding='same')(x)x = layers.Conv2DTranspose(32, 3, strides=2, activation='relu', padding='same')(x)x = layers.Conv2D(32, 3, activation='relu', padding='same')(x)# 输出层 - 8个类别(包括背景)outputs = layers.Conv2D(8, 1, activation='softmax')(x)model = tf.keras.Model(inputs=inputs, outputs=outputs)model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])return modeldef predict(self, image):"""对输入图像进行预测"""if image.ndim == 3:image = np.expand_dims(image, axis=0)return self.model.predict(image)def train(self, dataset, epochs=50, batch_size=8):"""训练模型"""callbacks = [tf.keras.callbacks.ModelCheckpoint('best_model.h5', save_best_only=True),tf.keras.callbacks.EarlyStopping(patience=5)]history = self.model.fit(dataset,epochs=epochs,batch_size=batch_size,callbacks=callbacks)return history

3.4 后处理模块

from skimage import morphology
from skimage.measure import label, regionprops
from scipy import ndimageclass PostProcessor:def __init__(self, geotransform):"""初始化后处理器"""self.geotransform = geotransformdef mask_to_polygons(self, mask, class_id, min_area=10):"""将掩膜转换为多边形"""binary_mask = (mask == class_id).astype(np.uint8)# 形态学操作去除小噪声binary_mask = morphology.opening(binary_mask, morphology.disk(1))# 填充小孔洞binary_mask = ndimage.binary_fill_holes(binary_mask)# 连通区域分析labeled = label(binary_mask)polygons = []for region in regionprops(labeled):if region.area >= min_area:# 获取边界坐标coords = region.coords# 转换为地理坐标geo_coords = []for y, x in coords:geo_x = self.geotransform[0] + x * self.geotransform[1] + y * self.geotransform[2]geo_y = self.geotransform[3] + x * self.geotransform[4] + y * self.geotransform[5]geo_coords.append((geo_x, geo_y))polygons.append(geo_coords)return polygonsdef refine_water_edge(self, water_mask):"""优化水边线提取结果"""# 使用形态学梯度获取边缘edges = morphology.dilation(water_mask) - morphology.erosion(water_mask)# 细化边缘skeleton = morphology.skeletonize(edges)# 转换为坐标点y, x = np.where(skeleton > 0)points = list(zip(x, y))# 排序点以形成连续线sorted_points = self._sort_points(points)# 转换为地理坐标geo_points = []for x, y in sorted_points:geo_x = self.geotransform[0] + x * self.geotransform[1] + y * self.geotransform[2]geo_y = self.geotransform[3] + x * self.geotransform[4] + y * self.geotransform[5]geo_points.append((geo_x, geo_y))return geo_pointsdef _sort_points(self, points):"""对点进行排序以形成连续线"""if not points:return []sorted_points = [points[0]]remaining_points = set(points[1:])while remaining_points:last_point = sorted_points[-1]nearest = Nonemin_dist = float('inf')for point in remaining_points:dist = (point[0]-last_point[0])**2 + (point[1]-last_point[1])**2if dist < min_dist:min_dist = distnearest = pointif nearest:sorted_points.append(nearest)remaining_points.remove(nearest)else:breakreturn sorted_points

3.5 矢量转换模块

import ezdxf
from ezdxf.addons import geoclass VectorExporter:def __init__(self, projection):"""初始化矢量导出器"""self.dwg = ezdxf.new('R2010')self.projection = projection# 设置空间参考self.dwg.header['$PROJECTION'] = self.projection# 创建图层self.layers = {'water_edge': self.dwg.layers.new('WATER_EDGE'),'road': self.dwg.layers.new('ROAD'),'bridge': self.dwg.layers.new('BRIDGE'),'vegetation': self.dwg.layers.new('VEGETATION'),'building': self.dwg.layers.new('BUILDING'),'pontoon': self.dwg.layers.new('PONTOON'),'revetment': self.dwg.layers.new('REVETMENT')}def add_polyline(self, points, layer_name):"""添加多段线到指定图层"""if len(points) < 2:returnlayer = self.layers.get(layer_name)if not layer:raise ValueError(f"未知图层: {layer_name}")msp = self.dwg.modelspace()msp.add_lwpolyline(points, dxfattribs={'layer': layer_name})def add_polygon(self, points, layer_name):"""添加多边形到指定图层"""if len(points) < 3:returnlayer = self.layers.get(layer_name)if not layer:raise ValueError(f"未知图层: {layer_name}")msp = self.dwg.modelspace()# 闭合多边形closed_points = points + [points[0]]msp.add_lwpolyline(closed_points, dxfattribs={'layer': layer_name})def save(self, filename):"""保存为DXF文件"""self.dwg.saveas(filename)def export_water_edge(self, points):"""导出水边线"""self.add_polyline(points, 'water_edge')def export_road(self, polygons):"""导出道路"""for polygon in polygons:self.add_polyline(polygon, 'road')def export_bridge(self, polygons):"""导出桥梁"""for polygon in polygons:self.add_polygon(polygon, 'bridge')def export_vegetation(self, polygons):"""导出植被"""for polygon in polygons:self.add_polygon(polygon, 'vegetation')def export_building(self, polygons):"""导出房屋"""for polygon in polygons:self.add_polygon(polygon, 'building')def export_pontoon(self, polygons):"""导出趸船"""for polygon in polygons:self.add_polygon(polygon, 'pontoon')def export_revetment(self, polygons):"""导出护岸"""for polygon in polygons:self.add_polyline(polygon, 'revetment')

3.6 主处理流程

class FeatureExtractionPipeline:def __init__(self, model_path=None):"""初始化处理流程"""self.feature_extractor = FeatureExtractor(model_path)self.class_names = ['background', 'water_edge', 'road', 'bridge','vegetation', 'building', 'pontoon', 'revetment']self.class_colors = [(0,0,0), (0,0,255), (255,0,0), (255,255,0),(0,255,0), (255,0,255), (0,255,255), (128,128,128)]def process_image(self, tiff_path, output_dxf):"""处理整个流程"""# 1. 预处理preprocessor = ImagePreprocessor(tiff_path)geotransform, projection = preprocessor.get_geo_info()image = preprocessor.enhance_image()# 2. 分割预测# 分块处理大图像height, width = image.shape[:2]patch_size = 512stride = 448full_mask = np.zeros((height, width), dtype=np.uint8)for y in range(0, height, stride):for x in range(0, width, stride):patch = image[y:y+patch_size, x:x+patch_size]if patch.size == 0:continue# 填充不足的块if patch.shape[0] < patch_size or patch.shape[1] < patch_size:padded = np.zeros((patch_size, patch_size, 3))padded[:patch.shape[0], :patch.shape[1]] = patchpatch = padded# 预测pred = self.feature_extractor.predict(patch)pred_mask = np.argmax(pred[0], axis=-1)# 放回原图位置if patch.shape[0] != patch_size or patch.shape[1] != patch_size:pred_mask = pred_mask[:patch.shape[0], :patch.shape[1]]full_mask[y:y+pred_mask.shape[0], x:x+pred_mask.shape[1]] = pred_mask# 3. 后处理post_processor = PostProcessor(geotransform)# 提取各类要素water_edge = post_processor.refine_water_edge(full_mask == 1)roads = post_processor.mask_to_polygons(full_mask, 2)bridges = post_processor.mask_to_polygons(full_mask, 3)vegetation = post_processor.mask_to_polygons(full_mask, 4)buildings = post_processor.mask_to_polygons(full_mask, 5)pontoons = post_processor.mask_to_polygons(full_mask, 6)revetments = post_processor.mask_to_polygons(full_mask, 7)# 4. 矢量导出exporter = VectorExporter(projection)exporter.export_water_edge(water_edge)exporter.export_road(roads)exporter.export_bridge(bridges)exporter.export_vegetation(vegetation)exporter.export_building(buildings)exporter.export_pontoon(pontoons)exporter.export_revetment(revetments)exporter.save(output_dxf)return {'water_edge': water_edge,'roads': roads,'bridges': bridges,'vegetation': vegetation,'buildings': buildings,'pontoons': pontoons,'revetments': revetments}

4. 精度评估与优化

4.1 评估指标实现

from sklearn.metrics import confusion_matrix, precision_score, recall_score, f1_scoreclass AccuracyEvaluator:def __init__(self):"""初始化评估器"""self.metrics = {'overall_accuracy': 0,'class_accuracy': {},'precision': {},'recall': {},'f1_score': {}}def evaluate(self, y_true, y_pred, class_names):"""评估预测结果"""# 展平数组y_true_flat = y_true.flatten()y_pred_flat = y_pred.flatten()# 总体精度self.metrics['overall_accuracy'] = np.mean(y_true_flat == y_pred_flat)# 混淆矩阵cm = confusion_matrix(y_true_flat, y_pred_flat)# 各类别精度for i, name in enumerate(class_names):tp = cm[i,i]fp = np.sum(cm[:,i]) - tpfn = np.sum(cm[i,:]) - tptn = np.sum(cm) - tp - fp - fnaccuracy = (tp + tn) / (tp + tn + fp + fn) if (tp + tn + fp + fn) > 0 else 0precision = tp / (tp + fp) if (tp + fp) > 0 else 0recall = tp / (tp + fn) if (tp + fn) > 0 else 0f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0self.metrics['class_accuracy'][name] = accuracyself.metrics['precision'][name] = precisionself.metrics['recall'][name] = recallself.metrics['f1_score'][name] = f1return self.metricsdef generate_report(self):"""生成评估报告"""report = "精度评估报告\n"report += "="*50 + "\n"report += f"总体精度: {self.metrics['overall_accuracy']:.4f}\n\n"report += "各类别精度:\n"for class_name in self.metrics['class_accuracy']:report += f"{class_name}:\n"report += f"  准确率: {self.metrics['class_accuracy'][class_name]:.4f}\n"report += f"  精确率: {self.metrics['precision'][class_name]:.4f}\n"report += f"  召回率: {self.metrics['recall'][class_name]:.4f}\n"report += f"  F1分数: {self.metrics['f1_score'][class_name]:.4f}\n\n"return report

4.2 优化策略

数据增强：增加训练数据的多样性
模型集成：使用多个模型投票提高准确性
上下文信息：考虑地物之间的空间关系
多尺度分析：结合不同尺度的特征
后处理规则：应用领域知识优化结果

5. 系统部署与使用

5.1 命令行接口

import argparsedef main():parser = argparse.ArgumentParser(description='无人机影像地物提取系统')parser.add_argument('input', help='输入TIFF文件路径')parser.add_argument('output', help='输出DXF文件路径')parser.add_argument('--model', help='自定义模型路径', default=None)parser.add_argument('--visualize', help='生成可视化结果', action='store_true')args = parser.parse_args()print("开始处理...")pipeline = FeatureExtractionPipeline(args.model)results = pipeline.process_image(args.input, args.output)print("处理完成，结果已保存到", args.output)if args.visualize:print("生成可视化结果...")# 可视化代码...if __name__ == '__main__':main()

5.2 批量处理脚本

import os
from concurrent.futures import ThreadPoolExecutordef batch_process(input_dir, output_dir, model_path=None, workers=4):"""批量处理目录中的所有TIFF文件"""if not os.path.exists(output_dir):os.makedirs(output_dir)tiff_files = [f for f in os.listdir(input_dir) if f.lower().endswith('.tif')]def process_file(filename):input_path = os.path.join(input_dir, filename)output_path = os.path.join(output_dir, os.path.splitext(filename)[0] + '.dxf')try:pipeline = FeatureExtractionPipeline(model_path)pipeline.process_image(input_path, output_path)return Trueexcept Exception as e:print(f"处理 {filename} 时出错: {str(e)}")return Falsewith ThreadPoolExecutor(max_workers=workers) as executor:results = list(executor.map(process_file, tiff_files))success_count = sum(results)print(f"批量处理完成，成功 {success_count}/{len(tiff_files)} 个文件")