Все это вопрос денег, наличия исходников, природы задачи (сильно связанная или слабо связанная), наличия времени.1. Если софт самописный, оптимизирован под Интел и при этом есть исходники.
Теоретически: максимальная монолитная машина - это бывший SGI Altix 4700. До 1000 процессоров Intel Itanium2 под управлением одного ядра операционной системы (SUSE). Памяти можно напихать до фига. Можно делать "косые" конфигурации: мало процов + много памяти и мало памяти + много процов (не знаю где так надо). Стоит как сбитый Боинг. Есть машинки попроще, но их уже переплюнули современные процы.
2. У интела существует взаимосвязь между сериями Xeon-ов и количеством процов(сокетов) в системе.
Поясню на примере: 3ххх процессоры - работают в односокетной конфигурации, 5ххх (в том числе и 55хх) - работают только в двух сокетной конфигурации, 7ххх (в том числе и 7460) - в четырехсокетной конфигурации.
Порядок цен: двухсокетная машинка - от 5k$ до 10-12k$, в зависимости от набивки. Четырехсокетная только начинается от 20k$.
3. Восьмиядерных процов у Интела нет. HT - вычеркиваем заранее, поскольку в математике от него проку нет, вообще нет.
4. Обратите внимание на такой участок как Процессор <=> Память. У современных процессоров 55-й серии он гораздо производительней, чем у 74-й. Т.е. если задача требует интенсивного обмена между процом и памятью, то на 74-й серии вы можете упереться в производительность шины и выкинуть деньги на ветер. Тут надо делать серьезный анализ.
5. 74-я серия становится _только_ в серверные матери, как впрочем и 55-я. Это Xeon-ы, т.е. априори серверные процессоры (несмотря на то, что ядра родственники десктопных)