O bioma
826 mil km² de soluções evolutivas que ninguém usou.
A Caatinga é o único bioma exclusivamente brasileiro. Suas condições extremas selecionaram microrganismos com adaptações que não existem em nenhum outro lugar do planeta.
Out-of-distribution
Por que a Caatinga é dado raro para IA
Microrganismos da Caatinga estão sub-representados em UniProt e PDB — bancos públicos sobre os quais os modelos globais de proteína (ESM3, AlphaFold) foram treinados. Em linguagem de machine learning, são out-of-distribution data.
Cada nova proteína validada vira dado proprietário valioso. Cada dado proprietário melhora o adapter LoRA treinado sobre o ESM3. Cada melhoria do adapter gera predições mais precisas. É o data flywheel — vantagem composta que se acumula no tempo.
Quanto menor a sobreposição, maior o valor do dado proprietário.
Funil de descoberta
Do bruto digital ao produto biológico, em seis etapas.
Sem IA, esse funil custaria décadas. Com IA, custa semanas.
Compliance como ativo
Não é burocracia. É blindagem competitiva.
A Lei 13.123/2015 (Marco da Biodiversidade), o Protocolo de Nagoya e o regime ABS criam barreira regulatória que impede concorrente estrangeiro de operar sobre biodiversidade brasileira. Para a BIATECK, compliance estruturado desde o dia 1 vira ativo defensável. Para Matwings, Shiru e Profluent, vira impossibilidade prática.
A biblioteca em números
Escala do ativo.
826.000 km²
Área total da Caatinga
27 estados
Onde a biblioteca pode ser distribuída como produto
~6.000+
Proteínas alvo previstas em fase 1 (24 meses)
100%
Proprietária. SisGen rastreável.
Projeções para os primeiros 24 meses de operação.