Ну, как алгоритмически - это их ноу-хау как

Ну, как алгоритмически - это их ноу-хау как раз wink. Сие сложно, но наработки в этой области есть же. Тот же Интеловский компилер под HT оптимизит же. И под двухъядерность обещают, насколько я помню...

Цитата:
The company said that it uses an "automatic parallelizing compiler" that uses profile information of software to "exploit parallelization patterns."

Паттерны вот какие-то. Предположу - есть образцы кусков однопроцового кода, и соотв. им куски параллельного. Т.е. видят кусок кода, коррелирующий с паттерном и лепят вместо него соотв. кусок параллельного. Это, конечно, весьма упрощенно, но думать дальше лень.;)

А аппаратно - а чем на ПЛИСЕ нехорошо? Загоняешь туда код, на выходе - другой код. ПЛИСы нынче практически сколь угодно сложные. Памяти к ней приделать кусок тоже не проблема. Вот интересно - они на каком этапе оптимизят - уже машинный код или на ЯВУ.