Dank dieser Optimierungen ist sie bis zu drei mal schneller als typische atoi() Implementierungen aus diversen Bibliotheken. Dabei wird nur ein trivialer Akkumulatoralgorithmus verwendet. Durch mehr Code, mehr Speicher und weiteres Ausreizen von CPU Details kann noch einiges an Performance herausgeholt werden. Beispielsweise könnte man auf einem Pentium statt byte-Arithmetik die '0' mittels int-Arithmetik von vier bytes gleichzeitig subtrahieren.
Hier wurde ganz besonders auf Parallelläufigkeit der U- und V-Pipeline des Pentium geachtet:
|
Diskussion |