High-Tech News

Une nouvelle utilisation de l’IA : résumer la recherche scientifique pour les sept ans

tldr paper hero

[ad_1]

L’écriture académique a souvent la réputation d’être difficile à suivre, mais que se passerait-il si vous pouviez utiliser l’apprentissage automatique pour résumer les arguments dans les articles scientifiques afin que même un enfant de sept ans puisse les comprendre ? C’est l’idée derrière papiers tl;dr – un projet qui tire parti des avancées récentes du traitement du langage par IA pour simplifier la science.

Le travail sur le site a commencé il y a deux ans par des amis universitaires Yash Dani et Cindy Wu comme un moyen « d’en savoir plus sur le développement de logiciels », raconte Dani. Le bord, mais le service est devenu viral sur Twitter au cours du week-end lorsque les universitaires ont commencé partager des résumés IA de leurs recherches. Les résultats générés par l’IA sont parfois inexacts ou simplifiés au point d’être idiots. Mais tout aussi souvent, ils sont d’une concision satisfaisante et étonnamment concise, coupant le jargon académique pour livrer ce qui pourrait être confondu avec la sagesse enfantine.

Prenez ce résumé d’un article du professeur Michelle Ryan, directrice du Global Institute for Women’s Leadership à l’Australian National University. Ryan a écrit sur le concept du « falaise de verre», une forme de discrimination fondée sur le sexe dans laquelle les femmes sont placées dans des rôles de leadership à des moments où les institutions courent le plus grand risque d’échec. Le résumé IA de son travail ? « La falaise de verre est un endroit où beaucoup de femmes se font mettre. C’est un mauvais endroit où être.

« C’est tout simplement excellent », comme l’a dit Ryan.

Ryan raconte Le bord le résumé était « précis et concis », bien qu’il ait éliminé beaucoup de nuances autour du concept. Cela s’explique en partie par une mise en garde cruciale : les articles du tl;dr n’analysent que les abstrait d’un article scientifique, qui est lui-même une version condensée de l’argumentation d’un chercheur. (Être capable de condenser un article entier serait un défi beaucoup plus grand, même si c’est quelque chose sur lequel les chercheurs en apprentissage automatique travaillent déjà.)

Ryan dit que bien que tl;dr papers soit sans aucun doute un outil très amusant, il offre également « une bonne illustration de ce à quoi devrait ressembler une bonne communication scientifique ». « Je pense que beaucoup d’entre nous pourraient écrire d’une manière plus conviviale », dit-elle. « Et le public cible d’un élève de deuxième année est un bon point de départ. »

Zane Griffin Talley Cooper, doctorant à la Annenberg School for Communication de l’Université de Pennsylvanie, a décrit les résumés de l’IA comme « d’une transparence rafraîchissante ». Il a utilisé le site pour condenser un article sur lequel il avait écrit « périphéries de données», qui retrace l’histoire physique des matériaux essentiels à l’infrastructure du Big Data. Ou, comme le disent les articles tl;dr :

« Le Big Data est stocké sur des disques durs. Ces disques durs sont constitués de très petits aimants. Les aimants sont extraits du sol.“

Cooper dit que bien que l’outil soit une « blague en surface », des systèmes comme celui-ci pourraient avoir de sérieuses applications dans l’enseignement et l’étude. Les résumés d’IA pourraient être utilisés par les étudiants comme un moyen d’obtenir des articles complexes, ou ils pourraient être incorporés dans des revues en ligne, produisant automatiquement des résumés simplifiés pour la consommation publique. « Bien sûr », dit Cooper, cela ne devrait être fait que « si encadré correctement et avec une discussion sur les limites et ce que cela signifie (à la fois pratiquement et éthiquement) d’utiliser l’apprentissage automatique comme outil d’écriture ».

Ces limites sont encore explorées par les entreprises qui fabriquent ces systèmes d’IA, même si le logiciel est intégré à des outils de plus en plus courants. tl;dr papers lui-même a été exécuté sur GPT-3, qui est l’un des outils d’écriture d’IA les plus connus et est fabriqué par OpenAI, un laboratoire de recherche combiné et une startup commerciale qui travaille en étroite collaboration avec Microsoft.

Microsoft a utilisé GPT-3 et ses semblables pour créer des outils tels que logiciel de saisie semi-automatique pour les codeurs et a récemment commencé offrir aux entreprises l’accès au système dans le cadre de sa suite cloud. La société affirme que GPT-3 peut être utilisé pour analyser le sentiment d’un texte, générer des idées pour les entreprises et, oui, condenser des documents tels que les transcriptions de réunions ou les échanges de courriers électroniques. Et déjà, des outils similaires à GPT-3 sont utilisés dans des services populaires tels que Gmail et Docs de Google, qui offrent aux utilisateurs des fonctionnalités de saisie semi-automatique alimentées par l’IA.

Mais le déploiement de ces systèmes en langage IA est controversé. À maintes reprises, il a été démontré que ces outils encodent et amplifient le langage nuisible en fonction de leurs données de formation (qui ne sont généralement que de vastes volumes de texte extraits d’Internet). Ils répètent stéréotypes et insultes racistes et sexistes et peut également être biaisé de manière plus subtile.

Un ensemble différent de soucis découle de l’inexactitude de ces systèmes. Ces outils ne manipulent le langage qu’à un niveau statistique : ils n’ont aucune compréhension humaine de ce qu’ils « lisent », ce qui peut entraîner des erreurs très élémentaires. Dans une exemple notoire qui a fait surface l’année dernière, la recherche Google – qui utilise l’IA pour résumer les sujets de recherche – a fourni des conseils médicaux trompeurs à une requête demandant quoi faire si quelqu’un souffre d’une crise. Alors qu’en décembre dernier, Alexa d’Amazon a répondu à un enfant lui demandant un défi amusant à relever en lui disant de touchez un centime aux broches exposées d’une prise de courant.

Le danger spécifique pour la vie posé par ces scénarios est inhabituel, mais ils offrent des illustrations frappantes des faiblesses structurelles de ces modèles. Jathan Sadowski, chercheur principal au laboratoire de recherche sur les technologies émergentes de l’Université Monash, était un autre universitaire diverti par le résumé de ses recherches par tl;dr papers. Il dit que les systèmes d’IA comme celui-ci doivent être manipulés avec précaution, mais ils peuvent servir un objectif dans le bon contexte.

« Peut-être un jour [this technology will] être si sophistiqué qu’il peut être cet assistant de recherche automatisé qui va vous fournir une bibliographie annotée parfaite, précise et de haute qualité de la littérature académique pendant que vous dormez. Mais nous sommes extrêmement loin de ce point en ce moment », a déclaré Sadowski Le bord. « L’utilité réelle et immédiate de l’outil est – avant tout – en tant que nouveauté et blague. Mais plus concrètement, je pourrais le voir comme un catalyseur de créativité. Quelque chose qui vous offre cette perspective étrangère sur votre travail.

Sadowski dit que les résumés fournis par les articles tl;dr ont souvent une sorte de « sagesse accidentelle » – un sous-produit, peut-être, de l’incapacité de l’apprentissage automatique à comprendre pleinement le langage. Dans d’autres scénarios, les artistes ont utilisé ces outils d’IA pour écrire livres et musique, et Sadowski dit que la perspective d’une machine pourrait être utile pour les universitaires qui ont creusé trop profondément dans leur sujet. « Cela peut vous donner une distance artificielle par rapport à une chose dont vous avez passé beaucoup de temps très près, de cette façon vous pouvez peut-être la voir sous un jour différent », dit-il.

De cette façon, les systèmes d’IA comme tl;dr papers pourraient même trouver une place similaire aux outils conçus pour promouvoir la créativité. Prenez, par exemple, « Oblique Strategies », un jeu de cartes créé par Brian Eno et Peter Schmidt. Il offre des conseils concis aux artistes en difficulté comme « demandez à votre corps » ou « essayez de faire semblant! » Ces paroles de sagesse sont-elles empreintes d’une intelligence profonde ? Peut-être peut-être pas. Mais leur rôle principal est de provoquer le lecteur dans de nouveaux modes de pensée. L’IA pourrait offrir des services similaires, et en effet, certaines entreprises vendent déjà des assistants d’écriture créative IA.

Malheureusement, bien que tl;dr papers ait été accueilli avec enthousiasme par le monde universitaire, son temps sous les projecteurs semble limité. Après être devenu viral ce week-end, le site Web a été étiqueté « en cours de maintenance », et les créateurs du site disent qu’ils n’ont pas l’intention de le maintenir à l’avenir. (Ils mentionnent également que d’autres outils ont été construits qui effectuer la même tâche.)

Dani a dit Le bord que tl;dr papers « a été conçu pour être une expérience pour voir si nous pouvons rendre l’apprentissage de la science un peu plus facile, plus amusant et engageant. » Il déclare : « J’apprécie toute l’attention que l’application a reçue et je remercie toutes les personnes qui l’ont essayée. [but] étant donné que cela a toujours été destiné à être un projet éducatif, je prévois de mettre fin aux articles tl;dr dans les prochains jours pour me concentrer sur l’exploration de nouvelles choses.



[ad_2]

Source link

You may also like

Leave a reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *