Safphere

探索 AI 安全技术前沿，展示研究成果

AI 模型安全评估研究

多模态内容安全分析

AI 安全测试框架开发

安全增强方案研究

研究方向

核心研究方向与技术成果

Savant4RedT

基于轻量化大语言模型的内容安全检测技术，支持危险内容识别、有害信息分析、内容重写和文本净化。

轻量化 LLM 模型：高效的文本分析

危险内容识别：准确检测有害信息

内容重写能力：自动文本优化

文本净化技术：去除有害内容

Savant4RedT-Vision

基于多模态模型的内容安全分析技术，支持文本、图像的跨模态安全检测，实现全方位的内容风险识别与防护。

多模态分析：支持文本和图像检测

跨模态理解：融合多种数据特征

实时风险识别：快速发现安全隐患

智能内容审核：自动化安全评估

Servool

一站式 AI 开发与部署平台，支持数据飞轮、模型训练、评估与部署的全流程管理。提供大模型、多模态模型、深度学习模型的定制开发与在线服务能力。

数据飞轮：持续积累高质量数据

模型训练：支持多类型模型定制

评估部署：一键完成模型落地

在线服务：提供模型体验能力

技术特点

AI 安全评估与防护的关键技术支撑

LLM 内容安全

基于轻量化大语言模型的内容安全检测技术，支持危险内容识别、有害信息分析、内容重写和文本净化，实现高效的文本安全防护。

多模态安全检测

基于多模态模型的内容安全分析技术，支持文本、图像的跨模态安全检测，实现全方位的内容风险识别与防护。

全链路应用平台

一站式的 AI 模型全链路安全测试平台，支持自定义训练与测试，支持定制化与自动化测试，支持安全报告生成。

安全部署与监控

提供模型多端部署方案，包括 GPU、NPU、国产显卡华为昇腾等，支持快速部署，端侧实现生成式 AI 的内容安全。

应用场景

广泛应用于各类AI安全场景

大模型安全评估

提供全面的大模型安全能力评估，包括对抗测试、越狱检测、隐私保护等。帮助企业全面了解模型的安全状况，及时发现并修复潜在风险。

自动化测试

漏洞扫描

安全报告

内容安全治理

针对AI生成内容的安全检测与治理，确保生成内容合规可控。支持多语言、多模态内容审核，提供详细的治理建议和优化方案。

内容审核

风险预警

治理报告

多模态安全

支持文本、图像多态内容的安全分析与风险识别。采用先进的多模态分析技术，准确识别跨模态安全风险，提供全面的防护方案。

跨模态分析

风险评估

安全防护

演示视频

研究团队

我们来自人工智能科技公司和高校研究团队

猫先生

Safphere 创始人

算法工程师，专注于工业视觉检测和生成式 AI 领域。有计算机视觉项目和大语言模型应用经验。

专业领域

计算机视觉工业检测生成式AI深度学习

那路

内容安全专家

在网络安全与内容安全领域有丰富经验。曾获得全国大学生信息安全竞赛国家级一等奖。致力于生成式 AI 的内容安全。

专业领域

内容安全网络安全生成式AI安全竞赛

fanqiNO1

技术负责人

活跃的开源社区贡献者，曾向 OpenMMLab、InternLM 社区等贡献超过50+ PR。

专业领域

计算机视觉大语言模型实时调度开源贡献

加入我们

如果你对AI安全充满热情，欢迎加入我们的团队，一起推动AI安全的发展

立即加入