Fundacja Dwa Serca
Raiffeisen Polbank
07 1750 0012 0000
0000 2358 4654















Modele lineaire

Ryan est un de nos ingénieurs de machine learning. En plus d`être le visage officieux de Nexosis, il passe ses journées à construire et tester des modèles, des algorithmes de réglage fin, et généralement être un gars sympa. Compte tenu de cette brève introduction au cas à deux variables, nous sommes en mesure d`étendre le modèle à son cas le plus général. Essentiellement, le GLM ressemble au modèle à deux variables illustré à la figure 4–C`est juste une équation. Mais la grande différence est que chacun des quatre termes dans le GLM peut représenter un ensemble de variables, pas seulement un seul. Ainsi, le modèle linéaire général peut être écrit: Enfin, bien que je comprends que vous avez déjà fait beaucoup d`analyse de données, considérez si vous devez vraiment utiliser les ratios de concentration comme variables prédictitrices. Les ratios sont notoirement gênants, en particulier si un dénominateur peut être proche de 0. Presque tout ce qui peut être accompli avec des ratios comme prédicteurs peut être fait avec des transformations de log des variables de numérateur et de dénominateur. Si je comprends bien votre situation, vous avez une seule variable de résultat (taux de production de certains produits chimiques) et de multiples concentrations mesurées d`autres produits chimiques; vous avez ensuite examiné divers ratios de ces autres produits chimiques comme prédicteurs pour la variable de résultat. Si vous avez plutôt formé un modèle de régression combinée qui a utilisé les concentrations logarithmique de tous les autres produits chimiques comme prédicteurs du résultat, vous pourriez vous retrouver avec un modèle plus utile, qui peut montrer des interactions inattendues entre les produits chimiques et peut encore être interprété en termes de ratios si vous le souhaitez.

Cette équation peut facilement être réécrite dans un format qui ressemble à l`équation de modèle linéaire général en utilisant la table de recherche ci-dessus: vous devriez être en mesure de voir que ce modèle nous permet d`inclure une énorme quantité d`informations. Dans une étude expérimentale ou quasi expérimentale, nous représentons le programme ou le traitement avec une ou plusieurs variables codées factices, chacune représentée dans l`équation comme une valeur x supplémentaire (bien que nous utilisons habituellement le symbole z pour indiquer que la variable est une code factice x). Si notre étude comporte plusieurs variables de résultats, nous pouvons les inclure comme un ensemble de valeurs y. Si nous avons plusieurs prétests, nous pouvons les inclure comme un ensemble de valeurs x. Pour chaque valeur x (et chaque valeur z), nous estimons une valeur b qui représente une relation x, y. Les estimations de ces valeurs b, et les tests statistiques de ces estimations, sont ce qui nous permet de tester des hypothèses de recherche spécifiques sur les relations entre les variables ou les différences entre les groupes.