Eric S. Raymond opracował program zwany „comparator” który wyszukuje wspólnych fragmentów kodu w drzewach kodu źródłowego. Na Athlonie 1.8 GHz porównuje ponad 55.000 linii na sekundę.Program używa wariantu algorytmu zwanego „shred”, który jest podobny do algorytmów stosowanych przy sekwencjonowaniu kodu DNA.

Kod źródłowy zostaje pocięty na nachodzące na siebie trój-liniowe kawałki, z których zostają wygenerowane sumy MD5. „Jeśli sumy się zgadzają, jest niemal pewne że dwa kawałki z których zostały otrzymane są takie same, z prawdopodobieństwem 18 kwadrylionów do 1. Sumy MD5 normalnie są używane do tworzenia podpisów, ale efekt uboczny którym się zajmuje to sposób na szybkie porównywanie tekstów” powiedział Raymond dla eWeeka. Ta technika ma dwie niezaprzeczalne zalety, po pierwsze jest bardzo szybka, po drugie można za jej pomocą porównać kody źródłowe nie posiadając oryginalnego kodu. Istnieją jeszcze dwa takie programy tworzone przez Erica Kidda i Mariusa Giuglea. Eric Raymond twierdzi jednak, że skontaktował się z oboma autorami i jego program jest najszybszy i ma znaczne usprawnienia.
Archiwalny news dodany przez użytkownika: darksoul.
Kliknij tutaj by zobaczyć archiwalne komentarze.

Share →