admin管理员组文章数量:1443006
大模型工业场景使用
使用AI大模型进行图像的识别,优缺点分别为:1.具有很好的泛化能力,很多场景都能够使用;2.速度慢:整体感觉速度太慢,比较吃硬件;
以焊缝识别为例,工业电脑将图片传递给大模型,能够对黑色缺陷点进行识别,但是每张图片大概2-3s,整体效率较低。
参考代码:
代码语言:javascript代码运行次数:0运行复制import requests
import json
import base64
from PIL import Image
import io
import os
def detect_face_orientation(image_data, site_url="", site_name=""):
"""识别图像中人脸朝向(1=朝左,0=朝右)"""
try:
# 1. 读取图像数据并转换为 base64
image = Image.open(io.BytesIO(image_data))
# 2. 将图像转换为 JPEG 格式
buffered = io.BytesIO()
image.save(buffered, format="JPEG")
base64_image = base64.b64encode(buffered.getvalue()).decode('utf-8')
# 从环境变量获取API密钥
api_key = os.getenv("OPENROUTER_API_KEY", "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")
# 3. 调用 OpenRouter API
response = requests.post(
url=";,
headers={
"Authorization": f"Bearer {api_key}",
"Content-Type": "application/json",
"HTTP-Referer": site_url,
"X-Title": site_name, },
json={
"model": "qwen/qwen2.5-vl-3b-instruct:free",
# 使用支持视觉的模型
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "请分析这张图片中的人脸朝向。如果人脸朝左返回0,朝右返回1。只返回数字,不要任何解释或额外文字。"
},
{
"type": "image_url",
"image_url": {
"url": f"data:image/jpeg;base64,{base64_image}"
}
}
]
}
],
"max_tokens": 1
},
timeout=30
)
# 4. 解析 API 响应
response.raise_for_status()
result = response.json()
answer = result['choices'][0]['message']['content'].strip()
if answer not in ['0', '1']:
return None
return int(answer)
except requests.exceptions.RequestException:
return None
except (KeyError, ValueError, json.JSONDecodeError):
return None
except Exception:
return None
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-03-28,如有侵权请联系 cloudcommunity@tencent 删除效率硬件image模型数据本文标签: 大模型工业场景使用
版权声明:本文标题:大模型工业场景使用 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/biancheng/1748094156a2805859.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论