Follow-up do épico #65. Só faz sentido agora que a telemetria de uso (usage_rollup) existe (#68/#69).
Hipótese
Essa métrica nos ajuda a entender como IA muda software delivery porque mede se o esforço de IA virou código durável ou retrabalho — cruzando input (tokens gastos por repo/período, do usage_rollup) com output (linhas sobreviventes / estabilização do engine) no mesmo grão. É a tradução numérica da tese central do épico.
Definição
Por (repo, período): durabilidade_por_token = (linhas AI-origin sobreviventes) / (output_tokens do agente naquele repo/período), normalizado por mil/milhão de tokens. Variante simples: estabilização_AI / Mtoken. Unidades explícitas; janela = a mesma lookback do dashboard. Edge cases: repos sem telemetria (N/A), divisão por zero (sem tokens → sem métrica), defasagem temporal entre análise de durabilidade (latest run) e o período de uso.
Fonte do sinal
múltiplas fontes
Risco de ranqueamento individual
Grão é (repo, período) vindo do usage_rollup, que não tem dimensão de pessoa. Mitigação reusa a supressão k-anonimato do #69 (só renderiza com ≥N contribuidores; abaixo cai em "outros"). Nenhuma tela por dev — Princípio #2 preservado por construção.
Chain checklist (releasa completa)
Notas / prior art
Decisão de design pendente: o cálculo cruza telemetria (plataforma) com durabilidade (engine/payload). Como o usage_rollup só existe na plataforma, o cruzamento provavelmente mora na camada de query da plataforma (estendendo computeAgentUsage), não no engine Python. Confirmar antes de implementar.
Hipótese
Essa métrica nos ajuda a entender como IA muda software delivery porque mede se o esforço de IA virou código durável ou retrabalho — cruzando input (tokens gastos por repo/período, do
usage_rollup) com output (linhas sobreviventes / estabilização do engine) no mesmo grão. É a tradução numérica da tese central do épico.Definição
Por (repo, período):
durabilidade_por_token = (linhas AI-origin sobreviventes) / (output_tokens do agente naquele repo/período), normalizado por mil/milhão de tokens. Variante simples:estabilização_AI / Mtoken. Unidades explícitas; janela = a mesma lookback do dashboard. Edge cases: repos sem telemetria (N/A), divisão por zero (sem tokens → sem métrica), defasagem temporal entre análise de durabilidade (latest run) e o período de uso.Fonte do sinal
múltiplas fontes
Risco de ranqueamento individual
Grão é (repo, período) vindo do
usage_rollup, que não tem dimensão de pessoa. Mitigação reusa a supressão k-anonimato do #69 (só renderiza com ≥N contribuidores; abaixo cai em "outros"). Nenhuma tela por dev — Princípio #2 preservado por construção.Chain checklist (releasa completa)
Notas / prior art
Decisão de design pendente: o cálculo cruza telemetria (plataforma) com durabilidade (engine/payload). Como o
usage_rollupsó existe na plataforma, o cruzamento provavelmente mora na camada de query da plataforma (estendendocomputeAgentUsage), não no engine Python. Confirmar antes de implementar.