Safphere

Safphere

探索 AI 安全技术前沿,展示研究成果

AI 模型安全评估研究
多模态内容安全分析
AI 安全测试框架开发
安全增强方案研究

研究方向

核心研究方向与技术成果

Savant4RedT

基于轻量化大语言模型的内容安全检测技术,支持危险内容识别、有害信息分析、内容重写和文本净化。

轻量化 LLM 模型:高效的文本分析
危险内容识别:准确检测有害信息
内容重写能力:自动文本优化
文本净化技术:去除有害内容
Savant4RedT

Savant4RedT-Vision

基于多模态模型的内容安全分析技术,支持文本、图像的跨模态安全检测,实现全方位的内容风险识别与防护。

多模态分析:支持文本和图像检测
跨模态理解:融合多种数据特征
实时风险识别:快速发现安全隐患
智能内容审核:自动化安全评估
Savant4RedT-Vision

Servool

一站式 AI 开发与部署平台,支持数据飞轮、模型训练、评估与部署的全流程管理。提供大模型、多模态模型、深度学习模型的定制开发与在线服务能力。

数据飞轮:持续积累高质量数据
模型训练:支持多类型模型定制
评估部署:一键完成模型落地
在线服务:提供模型体验能力
Servool

技术特点

AI 安全评估与防护的关键技术支撑

LLM 内容安全

基于轻量化大语言模型的内容安全检测技术,支持危险内容识别、有害信息分析、内容重写和文本净化,实现高效的文本安全防护。

多模态安全检测

基于多模态模型的内容安全分析技术,支持文本、图像的跨模态安全检测,实现全方位的内容风险识别与防护。

全链路应用平台

一站式的 AI 模型全链路安全测试平台,支持自定义训练与测试,支持定制化与自动化测试,支持安全报告生成。

安全部署与监控

提供模型多端部署方案,包括 GPU、NPU、国产显卡华为昇腾等,支持快速部署,端侧实现生成式 AI 的内容安全。

应用场景

广泛应用于各类AI安全场景

01

大模型安全评估

提供全面的大模型安全能力评估,包括对抗测试、越狱检测、隐私保护等。帮助企业全面了解模型的安全状况,及时发现并修复潜在风险。

自动化测试
漏洞扫描
安全报告
大模型安全评估
02

内容安全治理

针对AI生成内容的安全检测与治理,确保生成内容合规可控。支持多语言、多模态内容审核,提供详细的治理建议和优化方案。

内容审核
风险预警
治理报告
内容安全治理
03

多模态安全

支持文本、图像多态内容的安全分析与风险识别。采用先进的多模态分析技术,准确识别跨模态安全风险,提供全面的防护方案。

跨模态分析
风险评估
安全防护
多模态安全

演示视频

研究团队

我们来自人工智能科技公司和高校研究团队

猫先生

猫先生

Safphere 创始人

算法工程师,专注于工业视觉检测和生成式 AI 领域。有计算机视觉项目和大语言模型应用经验。

专业领域

计算机视觉工业检测生成式AI深度学习
那路

那路

内容安全专家

在网络安全与内容安全领域有丰富经验。曾获得全国大学生信息安全竞赛国家级一等奖。致力于生成式 AI 的内容安全。

专业领域

内容安全网络安全生成式AI安全竞赛
fanqiNO1

fanqiNO1

技术负责人

活跃的开源社区贡献者,曾向 OpenMMLab、InternLM 社区等贡献超过50+ PR。

专业领域

计算机视觉大语言模型实时调度开源贡献

加入我们

如果你对AI安全充满热情,欢迎加入我们的团队,一起推动AI安全的发展

立即加入