🔬

AI分析方法论完全公开

我们的AI分析不是黑箱。公开所有数据源、计算公式和判定标准。

Game Evaluation Lab's fraud score formula: Statistical Score × 0.7 + AI Analysis × 0.3. Using 8 data sources and Gemini AI natural language processing, we evaluate Steam reviews with full transparency. Our methodology is fully documented on this page.

⚖️ Comparison with Other Services

FeatureGame Evaluation LabTypical Checkers
Scoring basis✅ Fully public (this page)❌ Proprietary
AI UsedGemini + 6-axis statisticalUnknown / None
Update frequencyDaily (automated)Irregular
Data sources8 data sourcesReview counts only
Multilingual✅ JA/EN/KO/ZH❌ Single language

📡 数据来源

分析不依赖单一数据。整合8个独立信息源进行多维验证。

🎮
Steam Web APIPRIMARY

评测数据(文本·评分·游戏时长·投票数)、游戏信息、在线人数

💬
Steam社区论坛COMMUNITY

自动获取讨论主题,提取社区实际讨论的问题

📊
MetacriticEXTERNAL

媒体评分与用户评分,检测与Steam评价的偏差

🌐
Google Search GroundingGROUNDING

实时参考Reddit、游戏媒体、YouTube等外部评价

👤
用户提交评测USER

站内社区的直接评测

💰
价格历史数据PRICE

追踪促销价格,用于性价比判定

⚠️
异常事件检测ANOMALY

自动检测评测轰炸、评分急变等异常模式

📰
Steam News APINEWS

补丁说明·更新频率,衡量开发者活跃度

🔍 水军度评分计算方法

水军度采用两阶段混合方式计算。

STEP 1 — 统计水军分数(单条评测判定)

对每条评测按5项指标加分,计算所有评测的平均值。

游戏时长 < 1小时未充分体验产品
+30
评测文本 < 50字可能缺乏具体内容
+20
拥有游戏 < 5款可能是评测专用新账号
+15
评测发布 > 100条批量评测行为模式
+25
获得投票 = 0其他用户未认为有用
+10
上限:100分 | 所有评测平均值 = 统计水军分数
STEP 2 — AI取证分析

Gemini AI通过自然语言处理检测统计方法无法捕捉的模式。

Review Velocity (评测速度异常。检测短期内异常爆发和评测数量激增)
Review Sentiment Variance (评测情感偏差。识别游戏时长与情感评级的不匹配、内容矛盾和极端偏见)
Account Age Distribution (账号注册时间分布。衡量专门用于发表评测的新注册账号的比例)
Playtime Distribution (游戏时长分布偏差。极短游戏时长 0.1至0.5小时 内发表评测的统计聚类分析)
AI生成评测检测(模式重复、不自然文体、泛化赞美)
复制粘贴模板评测检测
STEP 3 — 混合分数(最终值)
最终水军度 = 统计分数 × 0.7 + AI判定 × 0.3

偏重统计方法以降低AI幻觉风险。

📐 六轴质量评估

每款游戏按6个质量轴评分0~100。

GRAPHICS
画面

视觉质量·美术风格·帧率稳定性

GAMEPLAY
玩法

操作感·机制深度·可重玩性

STORY
剧情

叙事质量·世界观·角色塑造

VALUE
性价比

价格对应内容量

VOLUME
体量

游戏时长·重玩性·终局内容

STABILITY
稳定性

BUG频率·崩溃·优化质量

🏆 综合等级系统

S
杰作

各指标最高水准,强烈推荐

A
优秀

无重大缺点,类型粉丝必玩

B
良作

品质稳定但有些许顾虑

C
平庸

体验平均,打折时可考虑

D
有问题

存在严重问题,建议慎重考虑

🧬 特殊分析模块

日英情感差距分析evaluation_gap

量化日语与英语评测的评价差异。

AI生成评测检测ai_generated_suspicion

检测泛化赞美、模式重复等AI生成评测特征。

GPU性能预测spec_analysis

按GPU等级分类评测中的硬件报告并可视化满意度。

游戏健康度诊断game_health

综合评估在线人数、更新频率、社区有害度。

评测矛盾检测review_contradictions

自动检测标记为"推荐"但内容消极的评测。

⚙️ AI模型与技术规格

AI引擎Google Gemini 1.5 Flash / Pro(自动回退机制,动态选择最新可用模型以确保高可用性)
温度设置 (Temperature)0.1(低随机性设定。极限抑制 AI 幻觉,确保分析结果的高度一致性与可重现性)
Top-P / Top-KTop-P: 0.95 / Top-K: 40(专为确定性情感提取和语言模式分类优化的过滤阈值)
Google Search Grounding启用(动态跨平台交叉引用 Reddit、Metacritic 及各大游戏媒体的外部口碑数据,与 Steam 评测进行对比)
提示词工程提示词工程(系统级结构化提示词,强制 JSON Schema 格式输出,彻底消除格式和内容偏差)
最大分析评测数40条/次(根据游玩时间权重和有用度,从最新评测中进行动态采样提取)
API 密钥轮换多密钥冗余自动轮换,检测到速率限制时实现瞬间无缝切换(Failover)
超时限制单次 API 请求 30 秒。在 Edge Runtime 环境下最大 85 秒内完成所有并行数据处理

⚠️ 限制与注意事项

① 仅为估值:水军度、FPS预测、品质分数均为AI估值,不保证100%准确。

② 评测采样:分析最多40条评测,大量评测的游戏可能存在采样偏差。

③ AI模型局限:可能无法完全理解讽刺、玩笑和文化差异。

④ 时点数据:分析基于缓存时的数据,大更新后评价可能显著变化。

常见问题

Q. 水军度如何计算?

两阶段计算:统计指标平均后Gemini AI进行NLP分析。最终 = 统计×0.7 + AI×0.3。

Q. 使用什么AI模型?

Google Gemini系列,自动回退动态选择最优模型。

Q. 六轴评价标准?

Graphics、Gameplay、Story、Value、Volume、Stability各0~100分。

Q. 数据更新频率?

分析数据首次缓存后定期重新分析。价格历史每日更新。

📋 Update History

A log of significant methodology changes and improvements. We record all changes for full transparency.

DateChangeImpact
2026-04-19Added Dataset structured data (Schema.org) to all ranking pagesSEO
2026-04-18Enhanced fraud score calculation explanation with clear rationaleTransparency
2026-04-15Color-coded 6-axis evaluation cards for improved visibilityUX
2026-04-13Complete Methodology page redesign with i18n supportTrust
2026-04-10Added Groq (Llama 3.3 70B) as fallback AI engineReliability
2026-03-20Implemented automatic DLC entry exclusion filterAccuracy
🔍 分析游戏