MyBioTech · Bilan de structure et de science · 2026-05-24 → 25

Vision → Exécution
la pile complète après 2 sessions

En 24 heures, on a posé deux couches indissociables : la science (atoms Paratopy, corpus structural, hypothèses testables) et la structure (org GitHub Team, branch protection, CODEOWNERS, sécurité automatique). L'une est stérile sans l'autre. Voici la pile vue d'avion — de la north star Gattaca au commit le plus récent.

Mission · Gattaca — genotype → personalized treatment Thèse · knowledge-as-moat (not model-as-moat) Posture · contrarian by design, bio-mimétique, EU-sovereign Stage · seed-stage research lab
4
Fondateurs
Etienne · Nathan · Samuel · Bassel
4
Layers de la spine
Vision · Infra · Dossier · Operating
22
Cibles évaluées
12 onco + 10 viral via SAbDab
3
Hypothèses testables
H1 V(D)J · H2 invariants · H3 FM registry
1
CVE auto-détectée
ROI immédiat du Team upgrade

01Vision · la north star et les principes

Gattaca est l'horizon : transformer le génotype en traitement personnalisé. L'ambition n'est pas de battre un benchmark — c'est de capturer une connaissance unique et compactable, qui devient le moat. Six principes filtrent toutes les décisions.

Principe 1
Knowledge-as-moat, pas model-as-moat. La connaissance curatée du domaine + RAG privé + orchestration MCP battent les LLMs génériques sur du travail pharma-grade.
Principe 2
Bio-mimétique. On encode V(D)J, hypermutation somatique et sélection clonale dans l'architecture — pas du brute-force structure calculation.
Principe 3
Contrarian by design. Paratopy n'optimise pas un benchmark connu : on cherche un signal d'alignement Ab-Ag qu'aucune méthode SoTA ne capte.
Principe 4
Federation de cerveaux qui co-évoluent. Pas une base monolithique — plusieurs bases couplées qui s'enrichissent mutuellement.
Principe 5
Engineering method. Build / test / learn rapide prime sur la méthode scientifique rigide. Wet-lab turnover rapide est un critère structurant.
Principe 6
Open-source neutre, low-budget. ESM-2 MIT > commercial licenses. La connaissance est le moat ; l'outil est interchangeable.

02Strategic spine · 4 layers

Quatre documents canoniques convergent sur la même thèse. C'est la colonne vertébrale de MyBioTech — chaque question stratégique part de l'un de ces 4 docs.

01
Layer · Vision
Castle Blueprint
MyBioTech_Castle_Blueprint.html
Le plan 6-layer / 12 mois. North star Gattaca. Cadre toutes les décisions de direction.
Stable
02
Layer · Infrastructure
Stack technique
fifth-brain repo + GitHub Team + EU-sovereign roadmap
Maintenant : GitHub Team sur repo privé `MyBiotech/fifth-brain` avec branch protection + CODEOWNERS + Dependabot. Plus tard : EU-sovereign (Bedrock EU + pgvector + MCP).
Upgraded ce soir
03
Layer · Dossier
KB v7 + Programmes
169-page Series A dossier · LRRK2 / GBA1 / TL1A
Le récit Series A et les programmes thérapeutiques (Parkinson LRRK2, Parkinson GBA1, IBD TL1A). Source du discours investisseur.
Audit en cours
04
Layer · Operating
WarRoom + cadence
WarRoom/ · watchlists · LinkedIn/Gmail workflow
Command center 10-folder lancé 2026-03-28. Phase 1 landscape-mapping gate Apr-25. Pilote la cadence quotidienne et le competitive tracking.
Cadence active

03La frontière atoms ↔ architecture (posée 2026-05-24, suite reset Nathan)

Le débordement Evo2 de mai 2026 a confondu principes scientifiques et choix d'outils. Reset : un atome est une claim falsifiable agnostique d'outil. Une architecture est un choix d'implémentation tracé en ADR. Test avant d'ouvrir une issue : "atome ou architecture ?". Si elle nomme un outil → ADR.

Atomes scientifiques

label `atom` + `science` + `paratopy`
  • #50 — [ATOM] Évolution : V(D)J, hypermutation, sélection clonale, GA. Bio-mimétique pur, agnostique d'outil.
  • H1 — Bio-mimétique : la diversité paratopique vs même épitope est-elle reproductible par V(D)J + hypermutation, ou faut-il un mécanisme additionnel ?
  • H2 — Alignement Paratopy : existe-t-il des invariants géométriques épitope → paratope que les méthodes SoTA ne captent pas ? (signal contrarien)
  • H3 — Registry FM : Evo2 vs ESM-2 vs ESM-IF1 — lequel sépare le mieux les Ab co-liants d'un même épitope ?
  • #38 umbrella : challenges Nathan, gestion centrale du framework.

Architectures (ADR)

label `adr` + `paratopy` (sans `science`)
  • #51 — ADR-FM-01 : registry minimal des Foundation Models candidats (Evo2, ESM-2, ESM-IF, ProteinMPNN, Boltz-2, IgFold, RFantibody, ESM3) + kill criteria génériques.
  • 2026-05-24-in-silico-lab-corpus.md : ADR project-local fixant la stratégie corpus (deep, onco+viral, SAbDab, 3 niveaux d'embedding). projects/paratopy/decisions/
  • Evo2 = candidat dans registry, pas capital. ADR-FM-01 le clarifie après le débordement de mai.
  • Architecture bicéphale ADN + protéine = choix d'archi, pas doctrine.

04Stack technique · le fifth-brain en 4 layers

Le repo MyBiotech/fifth-brain matérialise la philosophie "growing a knowledge organism". Quatre couches superposées. Chaque artefact qu'on produit s'inscrit dans l'une d'elles.

Layer 4 · Interfaces
Humans + Agents
Obsidian (lecture humaine du vault), CLI fb (ops), MCP (agents Claude). À venir : broadcast/ tool pour partage HTML/Markdown/Slides entre fondateurs.
Layer 3 · Index
Regenerable artefacts
embeddings.parquet · graph.json · search.sqlite. Reconstruisible à partir du vault. Jamais édité à la main.
Layer 2 · Vault — source of truth
Atomes markdown curatés
vault/Content/<id>.md avec frontmatter obligatoire. 77+ atomes aujourd'hui. Single write target — convention non négociable.
Layer 1 · Inbox
Raw, disposable
PDFs, transcripts, web clippings, voice memos. Filtré agressivement avant d'atteindre le vault.
fifth-brain/
├── vault/                      # the brain (layer 2)
│   ├── Content/                # curated atoms
│   └── _governance/            # schema + linter
├── pipelines/                  # the metabolism
│   ├── ingest/                 # PDF→md
│   ├── filter/                 # dedup, quality
│   ├── enrich/                 # frontmatter, tags
│   ├── embed/                  # sentence-transformers
│   └── publish/                # place into vault/
├── projects/                   # the muscles
│   └── paratopy/
│       ├── decisions/          # project-local ADRs
│       └── corpus/              # in-silico lab ✓ shipped
├── docs/                       # meta-docs
│   ├── decisions/              # repo-wide ADRs
│   └── governance/
├── founders/                   # personal wings
│   ├── etienne/  nathan/  samuel/  bassel/
├── .github/
│   ├── CODEOWNERS             # ✓ shipped ce soir
│   └── workflows/
│       └── lint.yml            # 3 jobs requis
├── scripts/
├── inbox/                      # layer 1
└── CLAUDE.md                  # agent operating manual

05Équipe · qui fait quoi (et le routing CODEOWNERS)

Trois actifs sur GitHub aujourd'hui, Bassel rejoint l'org quand il en aura besoin. Chaque fondateur a un wing personnel dans founders/<slug>/ et une zone de responsabilité principale routée via CODEOWNERS pour les PRs.

Etienne
@EtienneMat
Co-founder Science / AI. Direction stratégique, arbitrage transverse, intégration des composants IA. Senior-scientist register.
Reviews * (default fallback) founders/etienne/ + co-review tout le reste
Nathan
@NathanRgt
SoTA producer Paratopy. Validation scientifique des hypothèses, sélection des cibles, expertise structure antibody.
Reviews projects/paratopy/** vault/Content/paper-* founders/nathan/
Samuel
@jurassikclan-jpg
Lead fifth-brain infrastructure. Frère d'Etienne. Garant des conventions repo, governance, pipelines.
Reviews pipelines/ vault/_governance/ .github/ docs/
Bassel
non-membre de l'org
Co-founder Business. GTM, partnerships, legal, fundraising. Utilisation GitHub très occasionnelle.
Status 1 seat dispo dans l'org À inviter quand prêt

06Livré ces 24 dernières heures · les deux couches

Deux sessions, deux livraisons indissociables. La science avant la structure aurait été un script isolé ; la structure avant la science aurait été une cage vide.

Session 1 · 2026-05-24 soir
Couche scientifique — in-silico lab
  • ADR project-local : 2026-05-24-in-silico-lab-corpus.md (strat. profonde, onco+viral, SAbDab backbone, 3 niveaux embedding, ranking criteria).
  • Pipeline reproductible : projects/paratopy/corpus/ · 11 fichiers, ~400 LOC Python, aucune nouvelle dép.
  • 22 cibles évaluées sur SAbDab summary 2026-05-22 (21142 rows, 10783 PDB).
  • Premier ranking exporté en parquet + CSV : Tier 1 = SARS-CoV-2 Spike (1316 PDB), HIV Env (579 PDB), Influenza HA (298 PDB).
  • 4 anomalies remontées à Nathan pour validation (CD19 aliases, HER3 sans high-res, Ebola cryo-EM only, TROP2 émergente).
  • 3 hypothèses H1/H2/H3 formalisées avec protocole opérationnel.
Session 2 · 2026-05-25 matin
Couche structurelle — GitHub Team production-grade
  • Upgrade Free → Team : 4 seats, 3000 min CI/mois, repos privés illimités.
  • Branch protection sur main : 1 review obligatoire, CODEOWNERS, 3 status checks (python, tests, vault), no force-push, no deletion.
  • CODEOWNERS multi-codeowners : chaque rule ≥ 2 codeowners pour éviter le deadlock self-approval.
  • Sécurité activée en 1 commande : Dependabot alerts + automated security updates + secret scanning + push protection + non-provider patterns.
  • Merge settings hygiène : squash par défaut (titre = PR title), delete branch on merge, auto-merge dispo, merge commits désactivés.
  • 1 CVE détectée immédiatement (idna < 3.15, severity medium) → ROI du Team upgrade démontré en moins d'1h.
  • Limite gravée en mémoire : GitHub Team ne supporte plus Private Pages (seulement Enterprise) → broadcast tool ira sur Cloudflare Pages.

07Workflow PR · à partir de maintenant

Plus de push direct sur main. Chaque modification passe par une feature branch + PR, avec review codeowner et CI vert. Le bouton Bypass branch protections reste dispo aux 3 admins pour les urgences (audit trail conservé).

1 · Feature branch
git checkout -b feat/<slug>
2 · Push + PR
vers main
3 · CI lint
python · tests · vault
tous verts
4 · Review
≥1 codeowner approve
(routing auto)
5 · Squash merge
branche auto-supprimée

08Roadmap · ce qui vient

Trois horizons. Le court terme rentabilise tout de suite l'infra qu'on vient de poser. Le moyen terme livre les tests d'hypothèses. Le long terme remonte vers la north star Series A.

Court · 1-2 sem
Loop Nathan sur le corpus v0 : revue des 22 cibles, ajustement aliases (CD19 surtout), arbitrage HER3 / Ebola GP, ajouts éventuels.
Broadcast tool dans le repo : broadcast/ + CF Pages + CF Access (4 emails) — partage HTML/Markdown/Slides/Notebooks entre fondateurs sans Claude interposé.
Bassel onboarding dans l'org GitHub quand il en a besoin (1 seat dispo).
PR Dependabot sur idna ≥ 3.15 (automatique, juste à merger).
Moyen · 1-2 mois
v1 du corpus : download des structures 3D PDB pour Tier 1+2, déduplication Ab par CDR-H3 + germline, annotation Chothia complète.
Premier embedding : ESM-2 séquentiel sur SARS-CoV-2 + HIV Env (le terrain HIV avec 234 variants antigéniques est l'épreuve la plus dure pour H2).
Test H3 : retrieval triplet-loss Evo2 vs ESM-2 vs ESM-IF1 — premier vrai test du registry FM.
EU-sovereign hybrid : Claude API via Bedrock EU + pgvector privé pour le RAG, sortie progressive du Free tier vers l'infra cible.
Long · 3-6 mois
Tests H1 + H2 complets : ensembles V(D)J synthétiques vs paratopes observés, recherche d'invariants géométriques épitope → paratope sur Tier 1.
Wet-lab turnover rapide : critère structurant (cf. principe 5). Sélection partenaires CRO + design des premières expériences de validation.
KB v7 update : intégrer les résultats Paratopy dans le récit Series A. Cohérence Castle Blueprint ↔ programmes pharma.
HDS-certified target : remontée vers €45–65K/mois EU-sovereign quand la maturité le justifie.