diff --git a/TP2_hachage/Readme.md b/TP2_hachage/Readme.md index 7bdd89491ad4dbec634732d7c3cdfd7c9d07532a..85bcd2c10c0a67627890a94e93d4b0d6a79aeb1f 100644 --- a/TP2_hachage/Readme.md +++ b/TP2_hachage/Readme.md @@ -34,8 +34,8 @@ On recommence avec une liste collision qui contient les éléments à traiter. ### Explication de grand_tableau.extend(tableau) Nous avons des tableaux crée à chaque niveau pour contenir les résultats intermédiaire du hachage. -Cette ligne permet d'ajouter tout les éléments stockée dans tableau dans seul grand_tableau. Ca sert à regrouper toute les tables intermédiaires dans un seul grand tableau. -On va pouvoir ainsi récupérer les indices des k-mers dans un seul tableau. +Cette ligne permet d'ajouter tout les éléments qui sont stockés dans 'tableau' dans seul grand_tableau. +On va ainsi pouvoir regrouper toute les tables intermédiaires dans un seul grand tableau et simplifier l'accès aux indices des k-mers. ### Explication de: for kmer in set_kmer_courant: @@ -43,16 +43,16 @@ max_rang += 1 h = abs(hash(kmer)) mphf.append([h, max_rang]) -Ce bloc permet de donner un rang aux k-mer qui sera donc unique pour les cas où par exemple des collisions persisterais après avoir terminé de diminuer la table. -On parcours tous les kmers et on leurs attribut un rang +1 par au precedent. +Ce bloc permet de donner un rang aux k-mers, celui sera donc unique pour les cas où des collisions persisterais à la fin. +On parcours tous les kmers et on leurs attribut un rang +1 par rapport au précédent. On recupère le hash du k-mer puis on l'ajoute avec le rang à la MPHF ### Explication de pourquoi ici on ne mesure pas juste la taille en mémoire du tableau ? table_size.append(sys.getsizeof(tableau) + sys.getsizeof(mphf)) -Cette ligne permet de calculer la taille de tableau qui contient les k-mers placé à la position de leurs hash respectif +Cette ligne permet de calculer la taille de tableau qui contient les k-mers placé à la position de leurs hash respectif et est additioné à la taille de la mphf qui contient la fonction pour bien placer ces k-mers. -Il nous faut donc pour avoir une bonne estimation de l'utilisation de la mémoire prendre le tableau et la mphf. +Il nous faut pour avoir une bonne estimation de l'utilisation de la mémoire prendre le tableau et la mphf. Nous pourrons ensuite comparer avec la taille des dictionnaire python. Puis décommenter `compare_taille` à la fin et expliquer les résultats.