Définir + décrypter les données de qualité utilisées par l’IA dans les soins de santé avec Recursion
Invitée : Najat Khan, Ph.D., cheffe, Recherche et développement et cheffe des affaires commerciales, Recursion
Animateur : Brendan Smith, directeur, Outils de diagnostic et des sciences de la vie et analyste, Biotechnologie, TD Cowen
La série de balados La médecine à l’ère des machines : l’IA et les soins de santé de TD Cowen aborde un à la fois les différents aspects de la révolution intersectorielle de l’intelligence artificielle. Nous mettons en lumière certaines des plus grandes idées fausses sur l’utilisation actuelle et future de l’IA dans les soins de santé et visons à mettre en contexte les développements les plus récents et les plus importants dans ce domaine qui est défini par l’innovation rapide.
La série de balados La médecine à l’ère des machines : l’IA et les soins de santé de TD Cowen aborde un à la fois les différents aspects de la révolution intersectorielle de l’intelligence artificielle. Nous mettons en lumière certaines des plus grandes idées fausses sur l’utilisation actuelle et future de l’IA dans les soins de santé et visons à mettre en contexte les développements les plus récents et les plus importants dans ce domaine qui est défini par l’innovation rapide.
Dans cet épisode, Brendan Smith, analyste, Soins de santé à TD Cowen, reçoit Najat Khan, Ph.D., cheffe, Recherche et développement et cheffe des affaires commerciales à Recursion, pour lever le voile sur l’un des plus importants ensembles de données utilisés dans la découverte de médicaments au moyen de l’IA et nous aider à définir à quoi ressemblent des « données de qualité ». Nous examinons comment les données que vous recueillez, générez et utilisez pour former votre modèle d’IA jouent un rôle essentiel dans sa différenciation et sa réussite future.
Ce balado a été enregistré le 11 avril 2025.
Locuteur 1 :
Bienvenue à Insights de TD Cowen. Ce balado réunit des penseurs de premier plan qui offrent leur éclairage et leurs réflexions sur ce qui façonne notre monde. Soyez des nôtres pour cette conversation avec les esprits les plus influents de nos secteurs mondiaux.
Brendan Smith :
Bienvenue à la série de balados de TD Cowen. Intitulé « La médecine à l’ère des machines : l’IA et les soins de santé », l’épisode d’aujourd’hui présente les principaux enjeux dans l’évolution récente de l’IA et des soins de santé. Ici votre animateur, Brendan Smith, analyste des outils, Biotechnologie et sciences de la vie, à TD Cowen. Je suis en compagnie aujourd’hui de nulle autre que Najat Khan, Ph. D., cheffe, Recherche et développement, et cheffe, Affaires commerciales, à Recursion.
Heureux de vous recevoir, Najat.
Najat Khan, Ph. D. :
Merci. Ça me fait plaisir.
Brendan Smith :
Comme vous le savez tous, cette série de balados traite en détail de l’intelligence artificielle, cette véritable révolution à laquelle n’échappe aucun secteur. On y déboulonne les principaux mythes pour ensuite les recontextualiser dans le macrocosme des soins de santé. Le défi est de taille, mais demeure une entreprise utile.
Aujourd’hui, la Dre Khan et moi cherchons à lever le rideau sur l’un des principaux ensembles de données liés à l’IA. On va voir comment les données d’apprentissage, les données générées et celles que vous utilisez jouent un rôle essentiel dans la découverte de médicaments.
Comme moi, vous êtes sûrement tout le temps appelée à réponde aux questions d’investisseurs, d’universitaires, de sociétés qui veulent savoir comment distinguer les différentes plateformes d’IA, mais surtout, pour notre balado d’aujourd’hui, de quoi se compose un ensemble de données de qualité et quelle quantité de données d’apprentissage est nécessaire. J’entre dans le vif du sujet. Vous avez consacré une grande partie de votre carrière universitaire à l’aspect computationnel de la biologie et de la chimie, ce qui nous conduit en plein cœur de ce qu’on appelle maintenant la « techbio ». Donnez-nous d’abord une vue d’ensemble du secteur. Quels sont les principaux facteurs à considérer dans la création d’un modèle et d’une plateforme d’apprentissage automatique?
Najat Khan, Ph. D. :
C’est une très bonne question. Il y a tellement d’entreprises et de plateformes, qu’il faut regarder sous le capot. La première étape ne paraîtra pas évidente; il s’agit de déterminer à quelles questions on veut répondre. Quels éléments de base veut-on améliorer? Si on prend la découverte de médicaments, quels sont les deux ou trois aspects qui peuvent faire dérailler le taux de réussite? Premièrement, est-ce qu’on comprend globalement la biologie en cause dans la maladie? Deuxièmement, en ce qui concerne la conception de la molécule, quels sont les effets potentiels hors cible? On va donc parler, entre autres, de la capacité à prédire la toxicité. Et troisièmement, au niveau des essais cliniques, comment peut-on les simuler et quel patient risque de mieux répondre au traitement?
Une fois que l’on connaît les questions de base, il faut se demander quels sont les bons ensembles de données pour y répondre. Vous avez posé une question sur la quantité. Je veux aussi insister sur la qualité. Les deux sont importantes. Sur le plan de la quantité, si on n’a pas un minimum d’ensembles de données, statistiquement, ça ne fonctionne pas. Pour ce qui est de la qualité, les scientifiques des données et nombre de nos ingénieurs consacrent 50 % à 60 % de leur temps, sinon plus, à nettoyer les données, à éviter les redondances, à diminuer les erreurs, etc. On ne veut pas réduire le rapport signal sur bruit. Quand j’analyse les entreprises, je veux savoir quelles données, en qualité et en quantité, vont servir l’objectif et répondre aux questions de base.
Finalement, il ne faut pas oublier les algorithmes. Ils sont essentiels, mais la qualité à l’entrée se reflète à la sortie. Les ensembles de données sont d’une importance capitale. Souvent, on me demande pourquoi ça prend moins de temps dans d’autres secteurs; je pense à ChatGPT. Pourquoi est-ce si long de développer une plateforme propulsée par l’IA en techbio? La plupart des données nécessaires sont disponibles pour l’entraînement nécessaire à ChatGPT et à d’autres modèles d’apprentissage automatique. Mais, la compréhension de la biochimie se limite probablement à 10 ou 15 %. Il y a tellement de lacunes. Des entreprises comme Recursion et d’autres doivent investir pour générer en qualité et en quantité des ensembles de données sur mesure qui permettent de cartographier toute la biologie humaine. Pas seulement une protéine qui cause un problème, mais tout l’environnement et l’ensemble des voies et des liens qui aident à comprendre la biologie et, aussi, les effets potentiellement hors cible.
Brendan Smith :
Oui, ce n’est pas toujours le plus grand ensemble de données qui produit le meilleur modèle. Chez bien des investisseurs, la théorie circule depuis un certain temps voulant que le volume soit indispensable pour arriver plus rapidement à des résultats. Mais, à l’heure actuelle, ce n’est pas toujours le cas. C’est un excellent prétexte pour ma prochaine question. À votre point de vue, qu’est-ce qui peut faire que les investisseurs sous-estiment ou comprennent mal ce qui a déjà été accompli de ce côté?
Najat Khan, Ph. D. :
C’est une excellente question. Je vais parler de la découverte et du développement. Du point de vue de la découverte, notre compréhension de la biologie s’améliore. On repère de nombreuses nouvelles cibles à l’aide d’approches computationnelles, y compris l’IA et l’apprentissage profond. L’autre élément concerne la conception des molécules. Beaucoup de molécules s’appuient sur des outils computationnels. J’y vois deux volets. Il y a les produits biologiques. L’un des ensembles de données utilise la base de données sur les protéines. On parle de quelques centaines de milliers de structures très bien annotées qui contribuent à concevoir une foule de produits biologiques. Pour les petites molécules, on génère aujourd’hui certains de ces ensembles de données. Mais, par exemple, Recursion déploie plus de 20 programmes cliniques avec des partenaires ou en autonomie à l’interne. Nombre de ces molécules sont conçues en 18 ou 15 mois, bien moins que les 42 mois habituellement nécessaires à l’industrie, qui synthétise des dizaines de milliers de composés contre 200 ou 300 chez nous. Les signes de réussite commencent à apparaître.
Je ne veux pas exagérer. En fin de compte, il faut obtenir des résultats cliniques. Le taux de réussite est de 10 % dans l’industrie. Il faut tenter plusieurs fois d’atteindre l’objectif avant de comprendre ce qui se passe. Mais, les signes qui précèdent un point d’inflexion renvoient toujours à l’idée d’accélérer et d’améliorer la conception. Comment trouver la réponse plus rapidement? C’est du côté de la chimie et de la biologie que l’on voit les signes précurseurs de réussite.
Pour ce qui est du développement clinique, on commence à utiliser l’IA en médecine de précision et aussi pour le recrutement aux essais cliniques, qui demande beaucoup de temps. Le recrutement retarde dans 80 % des essais. Quant à la médecine de précision, si on ne sélectionne pas les bons patients, on diminue le rapport signal sur bruit. Il y a d’autres exemples où on commence à voir ces signes de réussite.
Brendan Smith :
Oui, je pense que c’est un point très important. Ces dernières années, je trouve que beaucoup veulent même se mêler de la conversation sur l’IA dans la découverte de médicaments. Pour certains investisseurs, inévitablement, les données de phase 2 sont à des années d’aboutir et celles de phase 3 sont encore plus loin dans le temps. Ils ne veulent pas attendre. Ils se demandent vers quoi se tourner. Depuis un certain temps, il n’y a pas une masse de renseignements accessibles au public, du moins pour nous, afin de pouvoir établir une comparaison. Votre équipe a le mérite d’évaluer combien de temps il a fallu pour mettre en place certains de ces programmes de développement, combien on en a élaborés, combien ont permis de gagner temps et argent en se basant sur des chiffres réels. Ça devient aussi monnaie courante à force d’en parler.
Voilà le prétexte idéal pour enchaîner le prochain sujet. Je veux aborder la question qu’on me pose tout le temps; c’est sans doute la même chose pour vous. Quelqu’un à l’extérieur de ces entreprises n’a pas accès à tous vos ensembles de données, à tous les modèles, à tous les algorithmes. Je ne suis pas informaticien, et, même si je l’étais, je ne saurais probablement pas à quoi ça rime. Ça peut être un analyste, un investisseur ou mon voisin qui raffole de science-fiction et s’intéresse soudainement beaucoup à l’IA. Comment le commun des mortels peut-il chercher à comprendre la valeur ou la qualité de l’ensemble de données d’une entreprise? Bref, qu’est-ce qu’on peut vous demander, à vous ou à vos homologues, pour mieux comprendre certaines différences entre les ensembles et les plateformes?
Najat Khan, Ph. D. :
Vous soulevez plusieurs aspects. Tout d’abord, qu’est-ce qui différencie cette plateforme? Je cherche toujours à savoir quel problème on veut résoudre parmi les trois que j’ai mentionnés : la biochimie, la sélection des patients, la médecine de précision. Ensuite, je veux voir des exemples; comment les ensembles de données apportent une solution, dans l’idée de comparer. J’aime avoir des points de référence. Troisièmement, j’essaie aussi de comprendre les ensembles de données. Je veux regarder sous le capot pour comprendre en quoi c’est exclusif. La quantité ne suffit pas; il faut aussi la qualité.
Finalement, c’est très important de comprendre l’expérience des équipes de direction. La découverte et le développement de médicaments m’inspirent énormément d’humilité. Comme vous l’avez dit, c’est une noble tâche très difficile. Il ne faut pas craindre l’échec. Le taux de réussite n’est que de 10 %. Je veux savoir combien de cicatrices et de blessures vos combats vous ont laissées. Savez-vous toute l’expérience qu’il faut accumuler pour reconnaître ce qui pourrait marcher? C’est très important en techbio. Par son savoir, le chasseur de molécules est un heureux mélange; il ne doit pas être trop frileux, mais plutôt réceptif à l’utilisation de l’apprentissage automatique. Ça s’apparente à un esprit bilingue. L’équipe est fondamentale.
Finalement, on peut avoir les meilleures données, les meilleurs algorithmes, les meilleures questions, mais comment se passe l’intégration? Quand et comment en profitez-vous pour fabriquer un meilleur médicament? Disposer d’un excellent algorithme pour prédire la liaison protéique, c’est bien, mais cible-t-il la protéine qui est réellement en cause dans la maladie? Est-ce que la molécule va circuler dans le corps assez longtemps pour faire son effet, plutôt que d’être absorbée par le foie en 30 minutes? La question se pose. Vous voyez ce que je veux dire? Il y a une foule d’aspects pratiques à considérer. Je suis à la recherche de personnes, d’idées et d’occasions à la fois audacieuses et pragmatiques.
Brendan Smith :
Oui, c’est du sur-mesure.
Najat Khan, Ph. D. :
Oui.
Brendan Smith :
On entend cette expression de plus en plus. La question posée cherche à savoir ce que l’on veut accomplir. Je ne parle pas de quête existentielle en général, mais nombre de ces modèles ont pour but de répondre à des questions précises. Quelles sont les vôtres?
Najat Khan, Ph. D. :
Oui.
Brendan Smith :
Dans quelle mesure réussissez-vous à obtenir une réponse? Est-elle bonne?
Najat Khan, Ph. D. :
Oui.
Brendan Smith :
Ça force beaucoup l’humilité.
Najat Khan, Ph. D. :
Je vous donne un exemple. Très centrée sur le patient, Recursion faisait à ses débuts du dépistage phénotypique, qui consiste à inactiver chacun des 20 000 gènes des lignées cellulaires ou des cellules primaires, peu importe, et à produire une carte de densité des interactions entre les gènes. En ajoutant des composés, on obtient des interactions avec les gènes. Pourquoi est-ce important? Parce que ça dessine une carte complète des voies, des familles protéiques, etc. C’est très bien. Mais ensuite, on comprend mieux aussi quel substrat chimique initial pourrait engager une modulation. Pourquoi je parle de ça? En quoi ça reprend l’idée du sur-mesure? Parce qu’on ne se limite pas à une seule catégorie de protéines, ce qui suppose un biais de sélection. On s’intéresse à l’ensemble du génome. Ça permet d’inactiver la surexpression, etc.
Je crois que c’est important aussi. Je veux comprendre les cas limites. À trop se concentrer sur un secteur, on ne voit pas toute la distribution, au risque de rater quelque chose. C’est vrai, par exemple, pour les données sur mesure. Il en va de même pour le développement clinique. Il faut des données sur les patients, bien sûr, des données phénomiques; mais j’ai besoin de données transcriptomiques. Je veux voir les résultats cliniques de patients. Je veux aussi des données génétiques. Une fois que l’on commence à construire cette pile, comme on l’appelle, pour créer une cellule ou une personne virtuelles, ça devient essentiel pour comprendre le lien entre les différentes couches et voir comment s’opère le passage du point de vue biologique aux résultats cliniques. C’est ce qu’on fait ici, en fin de compte. Parce qu’on essaie de fabriquer de meilleurs médicaments pour les patients.
Brendan Smith :
Cette idée d’une cellule clinique et d’une personne clinique, c’est à surveiller. Vous abordez aussi une question qui circule de plus en plus. Les entreprises limitées aux ensembles de données publics peuvent-elles concurrencer les plateformes de données exclusives?
Najat Khan, Ph. D. :
C’est une bonne question. Compte tenu de la quantité limitée de données sur mesure de qualité en biotechnologie ou en sciences de la vie dans une perspective plus large, la production de données va être importante.
Mais, voici ce qui se passe. Quand j’observe le monde, ça me rappelle Le Conte de deux cités, de Dickens. Certaines entreprises génèrent des données, mais ne posent pas toujours les bonnes questions. On collecte des données pour ce qu’elles sont. En construisant une plateforme, ça devrait créer de l’affluence. Ce n’est pas la bonne approche. Ça prend un but précis. Par contre, d’autres sociétés ne génèrent pas de données, mais les utilisent de façon très ingénieuse.
Ce qu’on veut, c’est jouer sur les deux tableaux. Il faut des données exclusives quand c’est important et les jumeler à d’autres ensembles de données existantes. Par exemple, comme je l’ai mentionné, on a des données exclusives en biochimie. Mais on collabore aussi avec des entreprises comme Tempest, Helix et aussi les équipes de développement clinique. Faire preuve d’opportunisme et d’intelligence, c’est le meilleur des deux mondes. Il faut ensuite se demander si on pose les bonnes questions. C’est important de les intégrer dans toute la pile : identification de cibles ou hypothèse biologique, chimie, développement critique, exécution clinique. C’est ce qu’il faut faire.
Brendan Smith :
Oui, et je pense que c’est un aspect très sous-estimé de la profondeur de tout le processus requis. Ça touche aussi une autre facette de la conversation. Il y a des domaines où les données cliniques ou bio-informatiques sont limitées pour l’apprentissage; je pense aux maladies orphelines, par exemple. Ça rejoint certains de ces ensembles de données d’apprentissage clinique. Comment surmonter certaines difficultés dans l’élaboration d’un modèle en espérant mettre au point un médicament pour une pathologie moins connue? L’accès à la population de patients n’est pas aussi grand. Quels sont certains des facteurs qui entrent en ligne de compte dans l’élaboration de ces modèles?
Najat Khan, Ph. D. :
C’est une excellente question. D’abord, du point de vue biologique, il faut comprendre l’étiologie; il existe des centaines de maladies rares, dites orphelines. Mais, dans le cas d’une maladie monogénique, du point de vue biologique, on peut faire appel au dépistage phénotypique par inactivation et à d’autres approches. C’est faisable. En contexte polygénique ou dans les cas complexes pour diverses raisons, les données multimodales deviennent essentielles pour stratifier les patients. La génétique n’est pas seule en cause. Il faut voir les aspects transcriptomiques et protéomiques, en plus des données sur les résultats cliniques.
Deuxièmement, c’est pourquoi l’IA générative et l’apprentissage actif sont si importants dans la conception d’une molécule adaptée. Recursion dispose de ses propres ressources, mais bénéficie aussi de l’acquisition, ou du regroupement, devrais-je dire, avec Exscientia. On pourra y revenir.
Mais, du point de vue clinique, je veux souligner deux choses. Comme vous l’avez mentionné, pour beaucoup de ces maladies, il est difficile de trouver des patients; le diagnostic tarde ou est erroné. La plupart des maladies rares échappent au diagnostic cinq ou six fois. Dans ma vie antérieure, au lieu d’utiliser des données réelles pour comprendre quels patients pouvaient être atteints, on faisait passer des ECG pour détecter, par exemple, l’hyperoxalurie primitive, une maladie rare. Les soins de première ligne permettent de repérer les patients beaucoup plus rapidement parce que les médecins ne pensent souvent pas à ces maladies rares. Mais les données et les algorithmes d’apprentissage profond sont utiles parce qu’ils sont beaucoup plus sensibles au signal. C’est un peu comme si la vision numérique se superposait aux images.
Aussi, il est très difficile de recruter des patients, entre autres, dans le cas des maladies rares. Personnellement, je travaille aussi là-dessus. J’utilise des données du monde réel, des données d’essais cliniques, auxquelles j’ajoute l’apprentissage automatique lié à l’IA pour déterminer où se trouve la population de patients la plus pertinente pour mon étude. Les données sont anonymisées, mais on sait de quel établissemet elles proviennent. On est axé sur le patient.
On utilisait au départ des lignées cellulaires, pas seulement des modèles animaux. Les modèles animaux permettent d’augmenter les lignées. C’est le but à atteindre, et non le point de départ. On explore également pour les organoïdes des approches liées à la toxicologie prédictive. On va en parler un peu plus dans le cadre des nouvelles directives de la FDA, une initiative fantastique. Ensuite, ça se passe en clinique. On va où se trouvent les patients plutôt que de consulter les sites connus, comme c’est le cas actuellement. Il ne faut pas se contenter d’utiliser nos connaissances, mais aussi celles du monde entier. Les données peuvent nous indiquer où se trouvent les patients pour accélérer le recrutement.
Brendan Smith :
Ça fait plaisir à entendre. Vous avez également mentionné la fusion entre Recursion et Exscientia.
Najat Khan, Ph. D. :
Oui.
Brendan Smith :
J’aimerais en parler davantage. Au début de l’année, votre fusion a créé un géant de l’IA, ce qui cadre bien dans notre conversation pour certaines raisons. Sans entrer dans l’aspect financier, en quoi le mariage technologique des plateformes a-t-il transformé Recursion en 2025 par rapport aux années précédentes?
Najat Khan, Ph. D. :
On est très complémentaires. Quand on crée une entreprise de techbio ou un géant biotechnologique, on veut une suite de bout en bout. À ses débuts en biologie, Recursion était à l’avant-garde de la découverte phénotypique de médicaments avant d’ajouter des couches multimodales. Exscientia a démarré du côté de la chimie : identification des cibles, optimisation des pistes. C’est impressionnant à voir.
La fusion des deux plateformes est très modulaire. J’adore ça. La technologie progresse très rapidement. On peut saisir la chance d’adopter le meilleur modèle en source ouverte ou utiliser les nôtres. On en revient au principe d’intégration. Il faut avoir les meilleurs algorithmes et ensembles de données d’IA à chaque étape de la question de base pour propulser le taux de réussite lié à la découverte et au développement de médicaments. C’est la première chose.
Deuxièmement, ça multiplie les options dans notre portefeuille. La complémentarité bénéficie à la plateforme et au portefeuille en oncologie et maladies rares, principalement. Ensuite, il faut recruter les meilleurs talents. Vous avez parlé de votre voisin tout à l’heure. On me pose tellement de questions. Dans ma vie antérieure, j’ai monté une équipe d’IA à partir de rien dans une grande entreprise. Je voulais des gens qui comprennent les approches computationnelles, l’IA, l’apprentissage automatique, etc., mais aussi la chimie, la biologie et le développement clinique. En plus de leur langue maternelle, ils se débrouillent assez dans une autre pour s’apprécier mutuellement. C’est l’une des choses les plus difficiles à faire. Rien de moins. J’ai eu une occasion en or de réunir les meilleurs éléments.
Brendan Smith :
Oui, vous avez parlé plus tôt d’une compréhension bilingue.
Najat Khan, Ph. D. :
Oui.
Brendan Smith :
J’adore aussi cette expression. C’est tout à fait approprié dans le contexte d’aujourd’hui.
Je m’en voudrais de ne pas aborder un autre sujet d’actualité que vous avez aussi évoqué : les nouvelles directives de la FDA qui viennent d’être publiées. Pour être franc, la FDA cherche à éliminer progressivement les exigences relatives aux tests sur les animaux pour les anticorps monoclonaux et peut-être d’autres modalités thérapeutiques qui restent à divulguer. Dans le communiqué, ce qu’on entend par « nouvelles approches méthodologiques » n’est pas tout à fait clair, du moins pour le moment. L’agence change complètement de paradigme. Plus précisément, je peux lire un extrait du Web : « En tirant parti de la modélisation computationnelle propulsée par l’IA, des tests de laboratoire fondés sur des modèles organoïdes humains et des données humaines du monde réel, nous pouvons accélérer l’offre de traitements plus sûrs et plus fiables, tout en réduisant les coûts de R-D et le prix des médicaments. C’est avantageux sur le plan de la santé publique et de l’éthique. » C’est tiré du communiqué de presse en ligne de la FDA.
Tout d’abord, j’aimerais savoir dans quelle mesure ça risque de transformer le secteur du développement de médicaments. Ensuite, qu’est-ce que ça signifie pour Recursion?
Najat Khan, Ph. D. :
Oui. Dans l’ensemble, c’est certainement la direction à prendre. J’adore cet extrait. Ça me parle beaucoup sur les plans scientifique et éthique, tant pour les patients que pour les animaux. J’adore les animaux, je tiens à le souligner.
C’est évident, mais le développement de médicaments nécessite de tester les modèles les plus pertinents pour l’utilisateur final. Ce sont les patients. Comme je l’ai dit, Recursion travaillait à ses débuts sur des lignées de cellules primaires et d’autres lignées cellulaires. C’est vraiment important pour comprendre au départ ce qui pourrait arriver aux patients.
On attendait ça depuis longtemps. C’est un pas dans la bonne direction. Les produits biologiques sont le point de départ. Il y aura sûrement d’autres modalités, mais je dois dire qu’on ne reste pas les bras croisés dans le secteur. Recursion et d’autres entreprises triment dur dans le domaine des organoïdes pour tester les lignées cellulaires, mais aussi un modèle translationnel susceptible d’être plus pertinent pour ce dont nous avons besoin. La pertinence est vraiment importante ici.
Il faut aussi mieux comprendre la stratification des patients. On n’en a pas beaucoup parlé, mais la stratification des patients est vraiment essentielle dans la découverte et le développement de médicaments. On veut faire de meilleurs médicaments, c’est ce qui me motive. Mais ce serait incroyable de comprendre ou de penser comprendre au tout début de la découverte quelle protéine cause telle maladie. J’aimerais savoir à ce moment-là quel patient va répondre ou non. La seule façon d’y arriver, c’est d’avoir des modèles plus représentatifs. Il reste encore beaucoup de travail à faire. Il faut encore raffiner les modèles organoïdes sur le plan technologique pour qu’ils répondent à nos besoins.
Il y a aussi la question de la toxicologie prédictive. Ça touche plusieurs aspects. Sans parler de la pharmacocinétique prédictive et des processus de l’ADME (absorption, distribution, métabolisme et élimination). C’est l’étape moins emballante, mais qui est très pratique et pertinente. Elle est très importante pour les produits biologiques. Mais 40 % des petites molécules tournent à l’échec, faute de prédictions sur la toxicité. C’est encore plus important pour les petites molécules. L’acquisition de Cyclica et de Valence et maintenant le regroupement avec Exscientia permettent à Recursion de se concentrer sur les modèles prédictifs de toxicité. Peut-on prédire de loin la toxicité? Même chose pour l’absorption, la distribution, etc. Il y a tout un éventail d’outils.
Est-ce que tout est toujours parfait? Non. Mais l’apprentissage récursif permet constamment de tester, de comprendre et de créer nos ensembles de données exclusives. L’automatisation est très importante pour produire à grande échelle des ensembles de données sur mesure qui sont de première qualité. Recursion est en bonne position. On a les données, les calculs, les algorithmes, et assez d’occasions de les tester pour poursuivre la découverte et le développement. Mais, globalement, c’est un pas dans la bonne direction. J’ai hâte de voir les progrès dans d’autres modalités. Il y a beaucoup de travail à faire, mais c’est encourageant à voir.
Brendan Smith :
Oui, c’est presque sans précédent à la FDA, et ce n’est pas un constat que l’on peut faire à la légère dans les conversations quotidiennes en 2025. Pourtant, on y est. Je suis certain que je vais continuer d’en discuter dans ce balado avec vous, mais aussi avec différentes parties prenantes du secteur.
On a abordé beaucoup de sujets aujourd’hui. Il y en a une foule sur lesquels on pourrait se pencher, mais la conversation risque de s’éterniser. Avant de vous laisser, dites-moi : si tout ce dont on a discuté aujourd’hui dépasse un peu l’auditeur, mais qu’il a su s’accrocher, quel point aimeriez-vous surtout qu’il retienne?
Najat Khan, Ph. D. :
On sait tous que le taux de réussite est trop faible : 10 % sur 10 ans. Le coût est tellement élevé. Je voudrais que l’on retienne l’absolue nécessité d’essayer. Il y a des hauts et des bas chaque fois que l’on fusionne de nouvelles disciplines Le modèle fonctionne-t-il parfaitement du premier coup? La plateforme fonctionne-t-elle parfaitement du premier coup? Surtout lorsqu’on constate dans le domaine tant de lacunes dans les données sur mesure, etc. Mais on doit faire avec, comme pour les directives de la FDA. C’est encourageant à voir. Le travail se poursuit depuis une décennie, mais c’est formidable. Si quelqu’un cessait d’essayer, on ne serait pas vraiment en train de changer de cap. Beaucoup de monde attend ça et y travaille déjà. Voilà ce que je dirais.
J’entends souvent des questions dans le genre « Pourquoi devrions-nous...? ». On ne peut pas se permettre de faire comme on a toujours fait pour toutes les raisons que j’ai mentionnées. J’adore la parole de Teddy Roosevelt, qui encourageait les hommes – dans le contexte actuel, je dirais les personnes – à se retrousser les manches et à trouver des solutions. C’est là-dessus que je travaille, davantage qu’à savoir si ça fonctionne ou pas. L’important, c’est le « comment » et le « qui ». Par conséquent, ce sont ceux qui se retroussent les manches qui peuvent changer les choses.
Dernière chose que je voudrais dire, il faut absolument en apprendre davantage sur l’IA. Beaucoup de gens, comme votre voisin, me pressent de questions. Je leur suggère toujours différents cours, etc. Mais, surtout avec ChatGPT et d’autres forums, c’est tellement facile d’apprendre aujourd’hui. Je vous invite à plonger dans l’apprentissage et à contribuer à nos efforts.
Brendan Smith :
Voilà un appel à l’action bien senti. Merci beaucoup de votre présence, Najat. Cet entretien a été fort agréable. J’ai hâte à notre prochaine conversation.
Najat Khan, Ph. D. :
Merci.
Ce balado ne doit pas être copié, distribué, publié ou reproduit, en tout ou en partie. Les renseignements contenus dans cet enregistrement ont été obtenus de sources accessibles au public, n’ont pas fait l’objet d’une vérification indépendante de la part de Valeurs Mobilières TD, pourraient ne pas être à jour, et Valeurs Mobilières TD n’est pas tenue de fournir des mises à jour ou des changements. Toutes les références aux cours et les prévisions du marché sont en date de l’enregistrement. Les points de vue et les opinions exprimés dans ce balado ne sont pas nécessairement ceux de Valeurs Mobilières TD et peuvent différer de ceux d’autres services ou divisions de Valeurs Mobilières TD et de ses sociétés affiliées. Valeurs Mobilières TD ne fournit aucun conseil financier, économique, juridique, comptable ou fiscal ou de recommandations dans ce balado. Les renseignements contenus dans ce balado ne constituent pas des conseils de placement ni une offre d’achat ou de vente de titres ou de tout autre produit et ne doivent pas être utilisés pour évaluer une opération potentielle. Valeurs Mobilières TD et ses sociétés affiliées ne font aucune déclaration ou ne donnent aucune garantie, expresse ou implicite, quant à l’exactitude ou à l’exhaustivité des déclarations ou des renseignements contenus dans le présent balado et, par conséquent, déclinent expressément toute responsabilité (y compris en cas de perte ou de dommage direct, indirect ou consécutif).

Directeur, Outils de diagnostic et des sciences de la vie et analyste, Biotechnologie, TD Cowen
Brendan Smith
Directeur, Outils de diagnostic et des sciences de la vie et analyste, Biotechnologie, TD Cowen
Brendan Smith
Directeur, Outils de diagnostic et des sciences de la vie et analyste, Biotechnologie, TD Cowen
Arrivé à TD Cowen en 2019, Brendan Smith couvre les outils de diagnostic et des sciences de la vie et le secteur de la biotechnologie. Il est titulaire d’une maîtrise ès arts, d’une maîtrise en philosophie et d’un doctorat en philosophie de l’Université Columbia.