Ce projet explore la façon dont les grands modèles linguistiques (LLM) peuvent améliorer l’agrégation et l’analyse des données T3010. Le rapport sur le paysage de 2024 de Fondations philanthropiques Canada (FPC) et le projet de délimitation de la portée qui a suivi avec les étudiants MPNL de l’Université Carleton ont mis en évidence des limites importantes en ce qui concerne l’actualité et l’exactitude des données sur l’octroi de subventions, qui entravent la capacité du domaine à répondre à des questions urgentes. Par exemple, l’agrégation des flux de subventions – un processus démontré par PFC – a nécessité plus de 80 heures de travail manuel pour produire un seul diagramme à barres. Les déclarations T3010, déclarées par les fondations elles-mêmes, demeurent la source de données la plus complète au Canada, malgré des délais de 18 à 24 mois, un système de classification vaste et désuet, et l’incapacité de répondre à des questions cruciales sur le comportement des fondations et l’impact de l’octroi de subventions.
Les récentes réformes réglementaires, telles que les changements apportés aux contingents de versement et aux déboursements non admissibles, visent à remédier aux inégalités sociétales et aux disparités dans l’allocation des ressources au sein du secteur philanthropique. L’adoption réussie de ces réformes, soutenues par diverses parties prenantes et par des objectifs d’équité, a mis en lumière des lacunes concernant les connaissances fondamentales sur le comportement en matière d’octroi de subventions. Ces lacunes constituent des obstacles importants à la compréhension des effets des changements politiques actuels et futurs.
Au cœur de ces défis se trouve l’utilité limitée du cadre classificatoire général de la T3010, qui ne parvient pas à saisir les nuances nécessaires à une analyse significative. Pour faire face à ce problème, ce projet utilisera de grands modèles linguistiques (LLM) et l’analyse de groupes pour développer une typologie plus détaillée et plus précise des activités de bienfaisance. Ce système de classification amélioré aidera le secteur philanthropique à répondre à des questions réglementaires et politiques clés, à améliorer la prise de décision fondée sur des données et à favoriser des résultats équitables dans l’ensemble de la société.
1. Comment les catégorisations existantes de l’ARC se comparent-elles à celles générées à l’aide de méthodes basées sur les grands modèles linguistiques?
2. L’augmentation du contingent de versement à 5 % a-t-elle entraîné une plus grande proportion de subventions accordées à de nouveaux bénéficiaires, ou profite-t-elle principalement aux organismes ayant des antécédents en matière de financement ?
3. Quelles sont les variations dans la façon dont les fondations réagissent aux modifications du contingent de versement dans les différentes catégories de programmes ?
Cette étude comporte 3 objectifs principaux :
1. Élaborer une typologie détaillée : Créer un système de classification des activités de subventionnement des fondations, en s’appuyant sur les grands modèles linguistiques (LLM).
2. Évaluer l’impact des politiques : Évaluer les effets des récents changements réglementaires, y compris les ajustements des quotas de déboursement et des déboursements non admissibles, sur le comportement en matière d’octroi de subventions et les modèles de distribution des ressources.
3. Faciliter la mobilisation des connaissances : Diffuser les résultats et les idées par le biais d’activités de mobilisation des connaissances ciblées, telles que des rapports, des webinaires et des documents universitaires ou politiques, afin d’impliquer les parties prenantes et de documenter les pratiques et les politiques.
Le projet tentera d’estimer la réactivité de l’octroi de subventions à l’exigence de distribution à l’aide d’un estimateur de regroupement. Cet estimateur exploite les points de masse dans une distribution normalement homogène pour estimer la réactivité des organisations au seuil de distribution. L’identification des regroupements (ceux accumulés dans le voisinage du point de masse) peut nous aider à identifier les organisations bénéficiaires des fondations les plus réactives au seuil. Ces bénéficiaires peuvent ensuite être analysés et comparés à un échantillon d’organisations de comparaison « toujours financées », « rarement financées » et « jamais financées » à l’aide d’un estimateur d’appariement par rapport à un score de propension.
5000$ de PhiLab