From fe42fa6cf997667c49c0ac939e5ae91d68f6758a Mon Sep 17 00:00:00 2001 From: Claude Date: Thu, 28 May 2026 19:42:17 +0000 Subject: [PATCH 1/2] docs: align ulk with Claude Opus 4.8 release MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Opus 4.8 (Claude Code 2.1.154) ships with effort default high (was xhigh on 4.7), fast mode at 2x rate / 2.5x speed, and dynamic workflows. Relative model aliases auto-resolve to 4.8 — no agent files change. Documentation updated to reflect the new defaults and rationale. - model-policy + agents-authoring: reframe effort: xhigh on opus agents as a deliberate override above the 4.8 default (high), not default-alignment - model mapping tables -> claude-opus-4-8 (CLAUDE.md, GEMINI.md, multi-provider-protocol, README); fast mode note added - context-hygiene Rule 5: mid-task system entries are cache-safe (model/MCP swaps still bust cache) - verify-protocol: Opus 4.8 honesty note; /ulk:verify stays mandatory - site-docs + session-defaults skill + install-reference: effort default and 1M-context mentions made version-agnostic (4.7/4.8) - native-features: document Dynamic Workflows (research preview, paid plans) and its positioning vs bruce/blackemperor; refresh /simplify behavior https://claude.ai/code/session_01S2q9F8a2fzdHkgkrgxoUAA --- .claude/rules/agents-authoring.md | 2 +- .claude/rules/install-reference.md | 4 ++-- .claude/rules/native-features.md | 16 +++++++++++++++- .claude/rules/session-practices.md | 6 +++--- CHANGELOG.md | 10 ++++++++++ CLAUDE.md | 6 ++++-- GEMINI.md | 2 +- README.md | 2 +- docs/site-docs/reference.md | 6 +++--- docs/site-docs/token-economy.md | 8 ++++---- .../agents/_shared/context-hygiene-protocol.md | 3 +++ framework/agents/_shared/model-policy.md | 8 +++++--- .../agents/_shared/multi-provider-protocol.md | 2 +- framework/agents/_shared/verify-protocol.md | 2 ++ .../community-skills/session-defaults/SKILL.md | 8 ++++---- 15 files changed, 59 insertions(+), 26 deletions(-) diff --git a/.claude/rules/agents-authoring.md b/.claude/rules/agents-authoring.md index 853070b2..369b617d 100644 --- a/.claude/rules/agents-authoring.md +++ b/.claude/rules/agents-authoring.md @@ -39,7 +39,7 @@ Référence complète : `_shared/discovery-protocol.md` § *Critères ULK-FDESC* **Vérifier** : `python3 framework/tools/description-audit.py` → score dans `docs/audits/agent-descriptions-.md` **Champs optionnels :** -- `effort: xhigh|low` — override le niveau d'effort de la session pour ce sous-agent. Règle ulk : `xhigh` sur tous les agents `model: opus`, `low` sur les agents `model: haiku`. Absent = défaut du modèle (`high` pour sonnet, `xhigh` pour opus 4.7). Ne pas utiliser `max` (session-only, prone to overthinking). +- `effort: xhigh|low` — override le niveau d'effort de la session pour ce sous-agent. Règle ulk : `xhigh` sur tous les agents `model: opus`, `low` sur les agents `model: haiku`. Absent = défaut du modèle (`high` pour sonnet **et** opus 4.8 — `xhigh` sur opus est donc une surcharge délibérée, voir `_shared/model-policy.md`). Ne pas utiliser `max` (session-only, prone to overthinking). - `memory: local` — uniquement pour les subagents `.claude/agents/` (persistent memory) - `isolation: worktree` — si l'agent doit travailler en worktree isolé (CC 2.1.49+). Bénéfices : contexte propre, pas de pollution main thread, branche dédiée pour review. **Piège** : les rapports écrits en chemin relatif disparaissent à la cleanup du worktree → toujours résoudre `MAIN_REPO=$(cd "$(git rev-parse --git-common-dir)/.." && pwd)` et écrire en absolu. Voir `_shared/worktree-protocol.md`. Agents concernés : vision (05), sargeras (45), ed209 (52), robocop (11) - `extends:` — liste des fichiers `_shared/` dont l'agent hérite (convention documentaire, voir ci-dessous) diff --git a/.claude/rules/install-reference.md b/.claude/rules/install-reference.md index aee991dc..5ef6c852 100644 --- a/.claude/rules/install-reference.md +++ b/.claude/rules/install-reference.md @@ -49,7 +49,7 @@ paths: ./install.sh --without-faru # opt-out : ne pas installer faru CLI. Bruce détecte alors les projets legacy (docs/07-spec/spec.md) et reste en mode obsidian. Pour pérenniser : déclarer `doc-mode: obsidian` dans le frontmatter de `CLAUDE.md`. ./install.sh --with-sentinel # + hook Sentinel (cascade xavier+ed209 pre-push, killbill+ed209 pre-deploy, mode remind par défaut) → ~/.claude/hooks/sentinel.sh · log: .ulk-reports/sentinel-log.jsonl · unlock: touch .ulk/sentinel-cleared ./install.sh --with-code-graph # + Code Review Graph MCP (ADOPT-CONDITIONAL, Python 3.10+ requis) : pip install code-review-graph && code-review-graph index . — gain −8.2× moyen (−49× cas optimal monorepo) · MCP-native 22 tools · Tree-sitter + SQLite -./install.sh --with-session-defaults # + skill /session-defaults (opt-in) — écrit CLAUDE_CODE_DISABLE_1M_CONTEXT=1 + CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=80 dans ~/.claude/settings.json ; désactive contexte 1M Opus 4.7, force compact proactif à 80% ; idempotent +./install.sh --with-session-defaults # + skill /session-defaults (opt-in) — écrit CLAUDE_CODE_DISABLE_1M_CONTEXT=1 + CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=80 dans ~/.claude/settings.json ; désactive contexte 1M Opus (4.7/4.8), force compact proactif à 80% ; idempotent ./install.sh --with-kami-skill # + skill kami (tw93) — documents pro (One-Pager, Long Doc, Letter, Portfolio, Resume, Slides) ; esthétique parcheminée + accents encre ./install.sh --with-container-clis # + bundle container (docker · kubectl · helm · k9s · lazydocker) ./install.sh --with-monitoring-clis # + bundle monitoring (vegeta · hyperfine · gping · mtr) @@ -137,7 +137,7 @@ cwb-app-icon (1, opt-in) : `/cwb-app-icon` — génère AppIcon.appiconset natif hue (1, opt-in) : `/hue` — génère un design language complet (design-model.yaml + SKILL.md + tokens + composants + previews HTML) à partir d'une marque, URL, screenshots ou codebase · installé sous `~/.claude/skills/hue/` via `--with-hue-skill` logo-generator (1, opt-in) : `/logo-generator` — génère logos SVG+PNG via Google Gemini API (~$0.01-0.05/image, requiert `GEMINI_API_KEY`) · pipeline 5 phases (brief → concepts → SVG → PNG → showcase) · installé sous `~/.claude/skills/logo-generator/` via `--with-logo-generator-skill` · hint d'invocation depuis Stark (58) caveman-output (1, opt-in) : `/caveman` — mode output télégraphique ; −79% tokens rapports agents (2b3, ci-guard), −18 à −24% session complète ; règle : clean→caveman, bloquant/🚨→normal ; aucun prérequis — installé sous `~/.claude/skills/caveman-output/` via `--with-caveman-output-skill` · spike : `docs/research/spike-caveman.md` -session-defaults (1, opt-in) : `/session-defaults` — écrit `CLAUDE_CODE_DISABLE_1M_CONTEXT=1` + `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=80` dans `~/.claude/settings.json` ; idempotent, non-destructif (merge) ; désactive contexte 1M Opus 4.7 → force 200K + compact auto à ~155K ; redémarrer Claude Code après application — installé sous `~/.claude/skills/session-defaults/` via `--with-session-defaults` +session-defaults (1, opt-in) : `/session-defaults` — écrit `CLAUDE_CODE_DISABLE_1M_CONTEXT=1` + `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=80` dans `~/.claude/settings.json` ; idempotent, non-destructif (merge) ; désactive contexte 1M Opus (4.7/4.8) → force 200K + compact auto à ~155K ; redémarrer Claude Code après application — installé sous `~/.claude/skills/session-defaults/` via `--with-session-defaults` tech-debt-audit (1, opt-in) : `/tech-debt-audit` — audit dette technique opinionné (3 phases : orient → audit 9 dimensions → deliverable), file:line cité, section *"looks bad but actually fine"* obligatoire, mode repeat-run (RESOLVED/NEW), spawn subagents si > 50k LOC ; produit `TECH_DEBT_AUDIT.md` à la racine du repo · ksimback, MIT — installé sous `~/.claude/skills/tech-debt-audit/` via `--with-tech-debt-skill` · **complémentaire** à sargeras (45) audit 10 axes scoré et ed209 (52) sécurité OWASP · hint d'invocation depuis sargeras (45) ai-adoption (1, opt-in) : `/ai-adoption` — mesure la part de code écrit avec IA depuis les signaux de commit git (footers `Generated with Claude Code`, trailers `Co-Authored-By`, identités bot copilot/devin/gemini/jules + l'ajout ulk du trailer `claude.ai/code` que loupe ne matche PAS) ; agrégation hebdo + adoption %, ground truth via `.ulk-reports/accountability.jsonl`, rendu deck délégué à visual-explainer (fallback table Markdown) ; pur shell + git, local, 0 token, aucune API. Reproduit la détection mono-repo de StephanSchmidt/loupe (MIT) sans son ingestion multi-plateforme (org-wide → wrapper le binaire loupe) — installé sous `~/.claude/skills/ai-adoption/` via `--with-ai-adoption-skill` · **complémentaire** à mathieu (61) métriques produit, killbill (56) coût, 2b3 (08) recap checkpoint web-design-guidelines (1, opt-in) : `/web-design-guidelines ` — review code UI contre les Vercel Web Interface Guidelines (a11y, focus states, semantics, performance, copy) ; fetch live des règles via `curl.md` à chaque run (fallback `defuddle` puis `WebFetch`) ; output terse `file:line` ; vercel-labs, MIT — installé sous `~/.claude/skills/web-design-guidelines/` via `--with-web-design-skill` · **complémentaire** à visual-auditor (03) visuel, frontend-qa (02) fonctionnel, agathe (60) DA design system diff --git a/.claude/rules/native-features.md b/.claude/rules/native-features.md index 5823b9e9..be0c7efe 100644 --- a/.claude/rules/native-features.md +++ b/.claude/rules/native-features.md @@ -42,4 +42,18 @@ Memory stored in `~/.claude/projects//memory/` with MEMORY.md index + t | blackemperor review | Code vs spec | Completeness matrix | ## `/simplify` — Built-in Simplification -Spawns 3 parallel agents (reuse, quality, efficiency). Integrated in vision and 2b3. +Depuis Claude Code 2.1.154, `/simplify` exécute une **review cleanup-only** (reuse · simplification · efficiency · altitude) et **applique** les correctifs (équivalent `/code-review --fix` sans la passe bug-hunting). Pour la chasse aux bugs, utiliser `/code-review` (sévérité réglable). Intégré dans vision et 2b3. + +## Dynamic Workflows — Orchestration native à grande échelle (research preview) +Depuis Claude Code 2.1.154 (Opus 4.8). Claude écrit dynamiquement des scripts d'orchestration qui lancent **des dizaines à des centaines de sous-agents en parallèle** dans une même session (en arrière-plan), **vérifie ses sorties** avant de rapporter, puis converge. Cas d'usage phare : migrations à l'échelle du codebase (centaines de milliers de lignes) du kickoff au merge, avec la suite de tests existante comme barre de validation. Voir ses runs : `/workflows`. + +**Disponibilité** : plans **Enterprise / Team / Max** uniquement (research preview). Pas d'activation côté ulk — c'est une capacité native du harness. + +**Positionnement vs orchestrateurs ulk** : +| | Dynamic Workflows (natif) | bruce (25) / blackemperor (18) | +|---|---|---| +| Parallélisme | dizaines–centaines de sous-agents anonymes | routage vers agents ulk spécialisés (domaine, mémoire) | +| Force | travail mécanique massif (migration, refactor large) | jugement, séquencement, connaissance projet | +| Verrou | plan payant + preview | disponible partout | + +Règle ulk : *Dynamic Workflows pour la masse mécanique homogène ; bruce/blackemperor pour l'arbitrage et le routage spécialisé.* Les deux se composent — un orchestrateur ulk peut déléguer une phase de migration brute à un dynamic workflow. À surveiller (backlog, pas d'intégration tant que la feature reste en preview + gated par plan). diff --git a/.claude/rules/session-practices.md b/.claude/rules/session-practices.md index 7839beb8..0b6f940a 100644 --- a/.claude/rules/session-practices.md +++ b/.claude/rules/session-practices.md @@ -110,8 +110,8 @@ L'effort de raisonnement (`/effort`) s'ajuste **par prompt**, pas par session. ``` /effort low # fixes mécaniques, reformatage /effort medium # plupart des prompts (économie massive vs défaut) -/effort high # raisonnement complexe -/effort xhigh # défaut Opus 4.7 — coding agentique +/effort high # défaut Opus 4.8 — coding agentique +/effort xhigh # tâches difficiles + workflows asynchrones longs (était le défaut sur 4.7) /effort max # rendements décroissants, rarement justifié ``` @@ -120,4 +120,4 @@ Règle : `medium` par défaut. `xhigh`/`max` uniquement pour la planification lo ## Skill `/session-defaults` (opt-in) - Écrit `CLAUDE_CODE_DISABLE_1M_CONTEXT=1` et `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=80` dans `~/.claude/settings.json` - Activation : `./install.sh --with-session-defaults` -- Économie estimée : significant reduction sur les sessions Opus 4.7 longues +- Économie estimée : significant reduction sur les sessions Opus longues diff --git a/CHANGELOG.md b/CHANGELOG.md index c66207b9..656f50b3 100644 --- a/CHANGELOG.md +++ b/CHANGELOG.md @@ -7,6 +7,16 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0 ## [Unreleased] +### Changed + +- **Alignement Claude Opus 4.8** (sortie 2026-05-28, Claude Code 2.1.154) — les alias relatifs `opus`/`sonnet`/`haiku` résolvent automatiquement vers 4.8, aucune modification d'agent requise. Mises à jour documentaires : + - `_shared/model-policy.md`, `agents-authoring.md` — le défaut effort Opus passe de `xhigh` (4.7) à `high` (4.8) ; ulk **conserve `effort: xhigh`** sur les 20 agents opus, désormais comme **surcharge délibérée au-dessus du défaut** (et non plus alignement sur le défaut). + - `CLAUDE.md`, `GEMINI.md`, `_shared/multi-provider-protocol.md`, `README.md` — table de mapping modèles → `claude-opus-4-8` ; ajout note fast mode (2× rate / 2,5× vitesse, 3× moins cher que sur modèles précédents). + - `_shared/context-hygiene-protocol.md` (Règle 5) — nuance : la Messages API accepte des entrées `system` mid-task → injection de contexte par les orchestrateurs cache-safe (changer modèle/MCP reste un cache miss). + - `_shared/verify-protocol.md` — note honnêteté Opus 4.8 (~4× moins de défauts laissés passer) ; le filet `/ulk:verify` reste obligatoire. + - `docs/site-docs/{token-economy,reference}.md`, `session-defaults` skill + `install-reference.md` — défaut effort + mentions 1M context rendues version-agnostiques (4.7/4.8). +- **Dynamic Workflows** (`native-features.md`) — documentation de la feature native research-preview (orchestration de dizaines–centaines de sous-agents, Enterprise/Team/Max) et de son positionnement vs bruce (25) / blackemperor (18). À surveiller, pas d'intégration tant que gated par plan + preview. `/simplify` mis à jour (cleanup-only + applique les fixes depuis 2.1.154). + ### Added - **Mécanisme anti-données-hardcodées (3 couches + agent)** — détecte secrets/tokens, config env-spécifique (URLs/IPs), magic numbers et PII/fake data. diff --git a/CLAUDE.md b/CLAUDE.md index a9fe0210..7d069b03 100644 --- a/CLAUDE.md +++ b/CLAUDE.md @@ -159,7 +159,9 @@ Activation : `./install.sh --with-session-defaults`. **PDF** : `pdftotext "$1" -` (texte brut → stdout) > `Read` (évite le chargement image coûteux). -**Effort par prompt** : `/effort low` (mécanique) · `/effort medium` (défaut) · `/effort high` · `/effort xhigh` (défaut Opus) · `/effort max` (rarement justifié). +**Effort par prompt** : `/effort low` (mécanique) · `/effort medium` · `/effort high` (**défaut Opus 4.8**) · `/effort xhigh` (tâches difficiles + workflows asynchrones longs) · `/effort max` (rarement justifié). Note : Opus 4.8 a abaissé le défaut de `xhigh` (4.7) à `high` ; ulk conserve `effort: xhigh` en frontmatter sur les agents opus comme surcharge délibérée (voir `_shared/model-policy.md`). + +**Fast mode** (`/fast`, Opus 4.8) — 2,5× plus rapide, et **3× moins cher** que sur les modèles précédents ($10/M input · $50/M output). Utile pour les itérations interactives où la latence prime. **Modèles sous-agents** : Haiku (mécanique, masse) · Sonnet (recherche, synthèse) · Opus (planification, arbitrages). @@ -212,7 +214,7 @@ Outils : `/caveman` · `rtk proxy ` · Référence : `_shared/base-rules.md | Alias | Claude Code | Codex | Gemini | Mistral | |-------|-------------|-------|--------|---------| -| opus | claude-opus-4-7 | o3 | gemini-2.5-pro | mistral-medium-3-5 | +| opus | claude-opus-4-8 | o3 | gemini-2.5-pro | mistral-medium-3-5 | | sonnet | claude-sonnet-4-6 | gpt-4o | gemini-2.5-flash | mistral-small-3-1 | | haiku | claude-haiku-4-5 | gpt-4o-mini | gemini-2.0-flash | mistral-nemo | diff --git a/GEMINI.md b/GEMINI.md index f39ca653..8ac96bce 100644 --- a/GEMINI.md +++ b/GEMINI.md @@ -81,7 +81,7 @@ gh pr list # GitHub CLI | Alias ulk | Claude Code | Gemini CLI | |-----------|-------------|------------| -| `opus` | claude-opus-4-7 | gemini-2.5-pro | +| `opus` | claude-opus-4-8 | gemini-2.5-pro | | `sonnet` | claude-sonnet-4-6 | gemini-2.5-flash | | `haiku` | claude-haiku-4-5 | gemini-2.0-flash | diff --git a/README.md b/README.md index 4cf43a19..332195ec 100644 --- a/README.md +++ b/README.md @@ -249,7 +249,7 @@ ulk tire parti des features récentes de Claude Code : | `/branch` (ex `/fork`) | 2.1.71 | Forks de conversation pour explorer plusieurs pistes | | `isolation: "worktree"` | 2.1.49 | Audits propres (Sargeras, ED-209) — voir `docs/todo.md` ULK-207 | | Subagent forké | 2.1.117 | `CLAUDE_CODE_FORK_SUBAGENT=1` réduit la pollution contexte des orchestrateurs | -| Opus 4.7 / Sonnet 4.6 / Haiku 4.5 | 2.1.111+ | Alias `opus`/`sonnet`/`haiku` dans frontmatter — résolution auto vers la dernière version | +| Opus 4.8 / Sonnet 4.6 / Haiku 4.5 | 2.1.111+ | Alias `opus`/`sonnet`/`haiku` dans frontmatter — résolution auto vers la dernière version | | `effort:` frontmatter | 2.1.111+ | Override le niveau d'effort par sous-agent (`xhigh` opus, `low` haiku) — protège la qualité même si la session est sur un effort plus bas | | `opusplan` model alias | 2.1.x | Opus en plan mode, Sonnet en exécution — **non recommandé pour ulk** (Bruce orchestre hors plan mode) | diff --git a/docs/site-docs/reference.md b/docs/site-docs/reference.md index 0cd36d10..498bcd48 100644 --- a/docs/site-docs/reference.md +++ b/docs/site-docs/reference.md @@ -42,8 +42,8 @@ Quick-access reference for ulk commands, paths, variables, and terminology. | `/compact Preserve: X. Discard: Y.` | Targeted compact | | `/effort low` | Minimal reasoning (mechanical tasks) | | `/effort medium` | Most prompts — efficient default | -| `/effort high` | Complex reasoning | -| `/effort xhigh` | Default for Opus 4.7 agentic coding | +| `/effort high` | Default for Opus 4.8 agentic coding | +| `/effort xhigh` | Hardest tasks + long async workflows (was Opus 4.7 default) | | `/effort max` | Rarely justified | ### Audits @@ -139,7 +139,7 @@ Quick-access reference for ulk commands, paths, variables, and terminology. | Variable | Default | Effect | |----------|---------|--------| -| `CLAUDE_CODE_DISABLE_1M_CONTEXT` | unset | Set to `1` to disable Opus 4.7's 1M context window, force 200K (auto-compact at ~155K) | +| `CLAUDE_CODE_DISABLE_1M_CONTEXT` | unset | Set to `1` to disable Opus's 1M context window (4.7/4.8), force 200K (auto-compact at ~155K) | | `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE` | unset | Set to `80` to trigger compact at 80% rather than at overflow | | `ANTHROPIC_API_KEY` | required for Managed Agents | Anthropic API key (first-party only — not Bedrock/Vertex) | | `AUTO_DREAM_MIN_HOURS` | 24 | Minimum hours between auto-dream cycles | diff --git a/docs/site-docs/token-economy.md b/docs/site-docs/token-economy.md index dd0e0d25..a9a7576f 100644 --- a/docs/site-docs/token-economy.md +++ b/docs/site-docs/token-economy.md @@ -101,7 +101,7 @@ Lock tools and model before the first request. Do not use `/model` mid-session. } ``` -- `CLAUDE_CODE_DISABLE_1M_CONTEXT=1` — disables Opus 4.7's 1M context, forces 200K (auto-compact at ~155K, more predictable and cheaper) +- `CLAUDE_CODE_DISABLE_1M_CONTEXT=1` — disables Opus's 1M context (4.7/4.8), forces 200K (auto-compact at ~155K, more predictable and cheaper) - `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=80` — triggers compact at 80% rather than at overflow Apply via: `./install.sh --with-session-defaults` (installs the `/session-defaults` skill) @@ -235,13 +235,13 @@ Injects a system prompt that forces terse mode on all Claude reports in the sess ## Effort Levels -Reasoning effort is adjusted per-prompt, not per-session. The default for Opus 4.7 (`xhigh`) burns ~2× the tokens of `medium` for most tasks. +Reasoning effort is adjusted per-prompt, not per-session. Opus 4.8 defaults to `high` (Opus 4.7 defaulted to `xhigh`); `xhigh` burns ~2× the tokens of `medium` for most tasks. ``` /effort low # Mechanical fixes, reformatting, no judgment required /effort medium # Most prompts — massive savings vs default -/effort high # Complex reasoning but not heavy planning -/effort xhigh # Default for Opus 4.7 agentic coding +/effort high # Default for Opus 4.8 agentic coding +/effort xhigh # Hardest tasks + long async workflows (was the Opus 4.7 default) /effort max # Diminishing returns — rarely justified (~2× xhigh cost) ``` diff --git a/framework/agents/_shared/context-hygiene-protocol.md b/framework/agents/_shared/context-hygiene-protocol.md index 8c8b8fee..705e2734 100644 --- a/framework/agents/_shared/context-hygiene-protocol.md +++ b/framework/agents/_shared/context-hygiene-protocol.md @@ -204,6 +204,9 @@ Le prompt cache est le levier le plus puissant dans Claude Code. Chaque cache hi | Retirer un outil mid-session | ❌ Invalide le préfixe — cache miss total | | `/model` mid-session | ❌ Invalide le préfixe — cache miss total | | Outil steady, usage continu | ✅ Cache hit répété — reset TTL gratuit | +| Entrée `system` injectée mid-task (Messages API, Opus 4.8) | ✅ Cache-safe — mise à jour des instructions sans casser le préfixe | + +> **Nuance Opus 4.8 (2026-05-28)** : la Messages API accepte désormais des entrées `system` dans le tableau `messages`. On peut **mettre à jour les instructions, permissions, budgets de tokens ou le contexte d'environnement en cours de tâche sans invalider le prompt cache** ni passer par un tour utilisateur. Cela ne lève **pas** l'interdiction de changer de modèle / d'ajouter-retirer un MCP mid-session (toujours un cache miss total) — mais l'injection de contexte par les orchestrateurs (`CONTEXTE PROJET:` aux sous-agents) devient cache-safe. ### À faire diff --git a/framework/agents/_shared/model-policy.md b/framework/agents/_shared/model-policy.md index dda409cf..2e2ef7df 100644 --- a/framework/agents/_shared/model-policy.md +++ b/framework/agents/_shared/model-policy.md @@ -5,7 +5,7 @@ Les agents ulk utilisent des **alias relatifs** dans leur frontmatter : ```yaml -model: opus # → dernier Claude Opus disponible (actuellement claude-opus-4-7) +model: opus # → dernier Claude Opus disponible (actuellement claude-opus-4-8) model: sonnet # → dernier Claude Sonnet disponible (actuellement claude-sonnet-4-6) model: haiku # → dernier Claude Haiku disponible (actuellement claude-haiku-4-5) ``` @@ -21,16 +21,18 @@ Le champ `effort:` dans le frontmatter d'un sous-agent **override le niveau de l ```yaml effort: low # haiku — scanners déterministes, pas de raisonnement -effort: xhigh # opus — orchestration, audit, raisonnement complexe (défaut Opus 4.7) +effort: xhigh # opus — orchestration, audit, raisonnement complexe (surcharge délibérée : Opus 4.8 défaut = `high`) # pas de champ # sonnet — défaut `high`, satisfaisant pour les tâches focalisées ``` +> **Note Opus 4.8 (2026-05-28)** : depuis Opus 4.8, le **défaut effort est `high`** (et non `xhigh` comme sur 4.7). Anthropic recommande `extra` (= `xhigh`) / `max` pour les tâches difficiles et les workflows asynchrones longs. ulk **conserve `effort: xhigh` sur tous les agents opus** — non plus pour s'aligner sur le défaut, mais comme **surcharge délibérée au-dessus du défaut** : orchestration, audits et reverse-engineering justifient le niveau de raisonnement maximal indépendamment de l'effort de session. + ### Attribution dans ulk | `effort` | Agents | Justification | |----------|--------|---------------| | `low` | godspeed (00), gandalf (34), tools-checker (43) | Haiku, scripts déterministes, output structuré — pas de raisonnement | -| `xhigh` | Tous les agents `model: opus` (20 agents) | Garantit le niveau de raisonnement maximal indépendamment de la session | +| `xhigh` | Tous les agents `model: opus` (20 agents) | Surcharge au-dessus du défaut Opus 4.8 (`high`) — garantit le raisonnement maximal indépendamment de la session | | *(absent)* | Tous les agents `model: sonnet` | Défaut `high` suffisant — pas de besoin de surcharger | ### Règles de gouvernance `effort:` diff --git a/framework/agents/_shared/multi-provider-protocol.md b/framework/agents/_shared/multi-provider-protocol.md index e6e05df9..d171afb6 100644 --- a/framework/agents/_shared/multi-provider-protocol.md +++ b/framework/agents/_shared/multi-provider-protocol.md @@ -61,7 +61,7 @@ ulk est architecturé autour du format Claude Code (frontmatter YAML + custom-co | Alias ulk | Claude Code | OpenAI Codex | Gemini CLI | Mistral Vibe | |-----------|-------------|--------------|------------|--------------| -| `opus` | claude-opus-4-7 | o3 | gemini-2.5-pro | mistral-medium-3-5 | +| `opus` | claude-opus-4-8 | o3 | gemini-2.5-pro | mistral-medium-3-5 | | `sonnet` | claude-sonnet-4-6 | gpt-4o | gemini-2.5-flash | mistral-small-3-1 | | `haiku` | claude-haiku-4-5 | gpt-4o-mini | gemini-2.0-flash | mistral-nemo | diff --git a/framework/agents/_shared/verify-protocol.md b/framework/agents/_shared/verify-protocol.md index 7dadafce..182ed7f9 100644 --- a/framework/agents/_shared/verify-protocol.md +++ b/framework/agents/_shared/verify-protocol.md @@ -6,6 +6,8 @@ > et adaptée à l'écosystème ulk (Faru cards + mode obsidian legacy). > > Référence : `framework/agents/session/65-verify.md` (slash command `/ulk:verify`). +> +> **Note Opus 4.8 (2026-05-28)** : Opus 4.8 est ~4× moins susceptible que 4.7 de laisser passer un défaut dans son propre code sans le signaler, et flague plus volontiers les incertitudes. Le filet `/ulk:verify` (et son câblage 2b3 / bruce / task-runner) reste néanmoins **obligatoire** : le modèle est plus honnête, pas infaillible — la matrice de conformité capture les écarts spec ↔ code qu'aucune auto-évaluation ne remplace. --- diff --git a/framework/community-skills/session-defaults/SKILL.md b/framework/community-skills/session-defaults/SKILL.md index a196ee81..7537b495 100644 --- a/framework/community-skills/session-defaults/SKILL.md +++ b/framework/community-skills/session-defaults/SKILL.md @@ -2,7 +2,7 @@ name: session-defaults description: | Writes recommended token-economy env vars to ~/.claude/settings.json: - CLAUDE_CODE_DISABLE_1M_CONTEXT=1 (forces 200K context on Opus 4.7, cheaper + earlier compact) + CLAUDE_CODE_DISABLE_1M_CONTEXT=1 (forces 200K context on Opus 4.7/4.8, cheaper + earlier compact) CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=80 (proactive compact at 80% vs overflow). Run once at setup. Idempotent — safe to re-run. Invoke with /session-defaults or "session defaults". @@ -15,7 +15,7 @@ metadata: # /session-defaults — Optimisation token economy -Applique les variables d'environnement recommandées pour réduire le coût des sessions Claude Code longues (Opus 4.7 notamment). +Applique les variables d'environnement recommandées pour réduire le coût des sessions Claude Code longues (Opus 4.7/4.8 notamment). ## Pourquoi @@ -23,7 +23,7 @@ Deux leviers indépendants, effet immédiat : | Variable | Défaut | Avec session-defaults | Gain | |----------|--------|----------------------|------| -| `CLAUDE_CODE_DISABLE_1M_CONTEXT` | `0` (1M actif sur Opus 4.7) | `1` (force 200K) | Compact auto à ~155K au lieu de ~820K — sessions plus courtes, cache prefix plus stable | +| `CLAUDE_CODE_DISABLE_1M_CONTEXT` | `0` (1M actif sur Opus 4.7/4.8) | `1` (force 200K) | Compact auto à ~155K au lieu de ~820K — sessions plus courtes, cache prefix plus stable | | `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE` | `95`+ | `80` | Compact proactif avant la dérive, préserve la qualité des réponses | Source : [Paweł Huryn — Claude Code's Limits Are Generous](https://x.com/PawelHuryn/status/2048170309396926577) · Boris Cherny (Anthropic). @@ -105,7 +105,7 @@ Afficher le résumé suivant à l'utilisateur : Variables actives : CLAUDE_CODE_DISABLE_1M_CONTEXT = 1 - → Opus 4.7 : contexte 1M désactivé, force 200K + → Opus (4.7/4.8) : contexte 1M désactivé, force 200K → Compact auto se déclenche à ~155K (~80% de 200K) → Préfixe de cache plus stable, sessions moins coûteuses From fdb2e416e794b0996c5bd5dbc3b58633eb341d9a Mon Sep 17 00:00:00 2001 From: Claude Date: Thu, 28 May 2026 19:44:04 +0000 Subject: [PATCH 2/2] chore: regenerate credits (CHANGELOG + SKILL.md edits) The Credits drift job runs generate-credits.cjs --check over the whole tree. This commit syncs CREDITS.md + credits.json with their sources after the Opus 4.8 doc changes. Also absorbs a pre-existing entry for the hardcode-audit skill (first-party, attribution pending) that was missing from the generated output. https://claude.ai/code/session_01S2q9F8a2fzdHkgkrgxoUAA --- CREDITS.md | 4 +++- site/src/data/credits.json | 10 ++++++++++ 2 files changed, 13 insertions(+), 1 deletion(-) diff --git a/CREDITS.md b/CREDITS.md index 0c3f1359..df216ff6 100644 --- a/CREDITS.md +++ b/CREDITS.md @@ -11,7 +11,7 @@ CLI registry, skills sources, vendored skill frontmatter, and a small curated file for inspirations and site design. To update it, change the underlying source and run `node framework/cheatheet/generate-credits.cjs`. -## Vendored skills — third-party (29) +## Vendored skills — third-party (30) Skills whose content is bundled in `framework/community-skills/`, credited to their upstream authors. @@ -44,6 +44,8 @@ to their upstream authors. - flutter-add-integration-test, flutter-add-widget-preview, flutter-add-widget-test, flutter-apply-architecture-best-practices, flutter-build-responsive-layout, flutter-fix-layout-issues, flutter-implement-json-serialization, flutter-setup-declarative-routing, flutter-setup-localization, flutter-use-http-package - **flutter** — harish · BSD-3-Clause · [github.com/Harishwarrior/claude-code-skills](https://github.com/Harishwarrior/claude-code-skills) · flutter-3.x - flutter-tester, owasp-mobile-security +- **hardcode-audit** — (attribution pending) + - hardcode-audit - **hue** — Dominik Martin · MIT · [github.com/dominikmartn/hue](https://github.com/dominikmartn/hue) · 1.1.0 - hue - **jeffallan-skills** — Jeffallan · MIT · [github.com/Jeffallan/claude-skills](https://github.com/Jeffallan/claude-skills) · 2026-05-15 diff --git a/site/src/data/credits.json b/site/src/data/credits.json index 34fcbb9b..a377070c 100644 --- a/site/src/data/credits.json +++ b/site/src/data/credits.json @@ -159,6 +159,16 @@ "owasp-mobile-security" ] }, + { + "family": "hardcode-audit", + "author": null, + "source": null, + "license": null, + "version": null, + "skills": [ + "hardcode-audit" + ] + }, { "family": "hue", "author": "Dominik Martin",