LILA
Troisième projet: Algorithme des K plus proches voisins
Dans ce projet nous avons cherché à déterminer si la fleur est un Sétosa, un Virginica ou un Versicolor. Pour cela, à l'aide d'un fichier "Iris" qui contient les données des fleurs (la longueur, la largeur et l'espèce), nous avons crée un algorithme permettant d'ouvrir le fichier Iris et de prendre toutes les données pour déterminer la catégorie d'une nouvelle plante qui n'est pas encore identifiée.

On importe des modules mathématiques qui vont permettre de calculer des formules qui ne sont pas dans les fonctions de base de Python.

"pandas" va permettre de lire le fichier iris.
Attribution de x et y au nom des colonnes du fichier iris.

On définit la fonction distance qui prend en paramètre x1, x2, y1, y2 qui vont être des chiffres à virgule.


On définit la fonction determiner_classe qui va permettre de mettre dans une des trois catégorie la fleur à classer.

On marque les données des fleurs (couleur, espèce) qui permettront de constituer le graphique.
Programme entier:


Le Titanic
Grâce à un algorithme et à un fichier annexe qui contient plusieurs données ( l'âge, la classe, le sexe, …etc...) sur les 891 passagers on va pouvoir déterminer les personnes qui survivaient le plus.
Nous avons essayé avec des données de personnes réelles mais le programme affiche toujours "décédé" car il n'est pas assez complexe pour le problème.
​
​

La classe qui compte le plus de survivants et le moins de victimes est la première classe.

Sur cet histogramme on voit que les personnes âgées de 0 à 10 ans sont la tranche d'âge pour laquelle il y a le plus de survivants et pour laquelle les survivants dépassent les victimes. Au contraire la catégorie des 20 ans et des 30 ans sont celles qui comptent le plus de victimes car ce sont des catégories qui ne sont pas privilégiées pour être sauvées. Plus les personnes sont âgées et plus la différence entre les victimes et les survivants diminue.

Le prix payé pour un billet influe aussi sur la chance de survie car plus le billet est cher, plus le passager à de chance de survivre. En effet, sur cet histogramme on voit que les personnes qui n'ont payé leur billet quelques dizaines d'euros sont plus de la moitié à être mortes.

Dans la colonne gauche, donc celle des femmes on voit qu'il y a plus de survivantes que de victimes car avec les enfants elles étaient sauvées en priorité.

On constate que pour avoir le plus de chance de survie le mieux est d'avoir un parent puis deux parents avec une égalité entre le nombre de victimes et de survivants. Au contraire, les personnes n'ayant pas de parent est la catégorie avec plus de la moitié qui sont des victimes en plus d'être la catégorie la plus nombreuse.

Lorsqu'une personne n'a pas de frère ni de sœur alors elle a une chance sur deux de survivre. Si elle a un frère ou une sœur elle a un peu plus de chance de survivre et au dessus de deux elle a plus de chance de décéder.