Ir ao conteúdo
  • Cadastre-se

AMD Shanghai/Deneb, Istanbul/Thuban - Tópico Oficial


jonasnoia

Posts recomendados

O AMD Shanghai é a nova versão em 45nm (nanômetros) do processador para servidores Barcelona, enquanto o Deneb é a versão desktop do Shanghai.

O CPU terá em sua 1° versão 6MB de cache level 3 compartilhado entre os quatro núcleos, 512KB de cache level 2 exclusivo para cada núcleo e espera-se seja 35% mais rápido que o Barcelona e 30% mais econômico.

AMD Shangai core:

amd039sshangaidiesizeidzn9.th.jpgthpix.gif

Phenom II X4 940 overclock para 4.0 Ghz:

thpix.gif

price_02.jpg

AMD Phenom II Roadmap:

1237334.jpg

Os primeiros CPUs para o mercado Desktop baseados no Shanghai, os Deneb, serão lançados ainda em Janeiro de 2009 sob o nome Phenom II X4 940 Black Edition 3.0 Ghz e Phenom II X4 920 2.8 Ghz ambos somente para AM2+. O restante da série serão lançados em fevereiro ai sim para AM3 com suporte à DDR II e DDR III, são eles o restante da série Phenom II X4 900, Phenom II X4 800 e por últimos os Phenom II X3 700.

Na família Phenom II X4 800 o cache level 2 provavelmente permanecerá como a de seus irmão maiores da série 900, ou seja 512 KB por núcleo, o que deve diminuir é o cache level 3, de 6MB para 4 MB.Os Phenom II X3 700 como possuem um núcleo a menos permanecerão com a mesma quantidade de cache level 3 que dos Phenom II X4 série 900.

1237333.jpg

Segundo o gráficos acima da AMD o Phenom II X4 940 Black Edition 3.0 Ghz, em contraste com os antigo Barcelona, tem overclock fácil com a refrigeração adequada e em stock mantém o mesmo TDP que o Phenom X4 9950 2.6 Ghz, ou seja 125W.

1237344.jpg

E ainda tem mais chegando como os novos CPUs sem o cache level 3 são eles os Athlon X4 série 600 com freqüências de até 2.7 Ghz e 2MB de cache level 2, os Athlon X3 série 400 com freqüências de até 2.8 Ghz e 1.5 MB de cache level 2, e por fim os novos Athlon X2 série 200 com freqüências de até 2.8 Ghz de núcleo Regor e 2MB de cache level 2.

Tabela completa dos novos processadores para desktop:

imagemti7.png

thpix.gif

A AMD está lançando o Shanghai.

E realmente é um CPU sólido, de pontuação 20-30% mais elevada que o Barcelona e geralmente, bate o Intel Penryn em FP, mas ganha por muito puco. Em qualquer caso esta renovada a concorrência.

É simplesmente um Barcelona encolhido de 65nm para 45nm, e um extra de 4MB de cache L3 (6MB total) passou de 2,0 à 2.5GHz e de 2.3 à 2.7GHz, mantendo o mesmo TDP e ainda mais alguns extras...

Há um monte de pormenores, alterações e correções a partir do Barcelona. Obviamente o novo processo de 45nm, melhor prefetch, mais e melhor cache, HyperTransport 3,0 (HT3), virtualização mais rápida, RAS funcionalidades de cache e alguma coisa chamada "Smart Fetch".

Temos o melhor prefetch, isto permite o CPU puxar coisas da memória para o cache de uma maneira mais inteligente. Se alguns dados não estiverem no cache o CPU essencialmente senta e espera, por vezes dezenas ou centenas de ciclos.

Relacionado a isso está o maior cache L3 partindo de 2MB à 6MB. Isso adiciona 10-15% mais desempenho, um número que parece bastante plausível. O maior ganho não será exibido nos slides. Dizer que o L1 e L2 do Barcelona foi lento e não funcionou muito bem é também plausível. O Shanghai melhora tudo isto em uma maneira grande.

0 HT3 é um grande negócio, principalmente por causa da retro compatibilidade. Atuais placa-mães S1207 para o Barcelona podem ter um Shanghai com uma atualização de BIOS. O S1207 não usa o HT3 portanto o Shanghai sera conectado a ele mas vai funcionar no modo HT1. Quando o novo chipset SR5690 sai em meados de 2009 isso deixará de ser um problema.

Virtualização é uma das áreas onde a AMD ainda lidera na maioria das formas, com o Shanghai não será diferente. Ele tem o "Enhanced Rapid Virtualization Indexing" (RVI) 25% mais rápido.

Voltamos para o cache L3. O Shanghai pode mapear partes do cache que vão mal, um recurso chamado "L3 Cache Index Disable"(Índice Desabilitador de Cache L3). É pouco provável que seja usado mas se for necessário poderá salvar um sistema de alguns erros bastante desagradáveis.

Temos outra característica do chamado núcleo L3 e "Smart Fetch" (SF), uma das mais curiosas características do Shanghai. O que isso faz não é realmente retirar alguma coisa, é mais um cache para poupar recursos. O SF tem basicamente o conteúdo do cache L1 e L2 (cada um tem o seu próprio núcleo) e guarda para o L3. Isso permite que o núcleo seja transformado completamente "on the fly" sem perder nenhum dado. Sim, é uma característica de eficiência energética, e a AMD crédita até 21% de economia de energia a partir dele.

Outras coisas não estão diretamente relacionadas ao núcleo mas também adiciona desempenho aqui e ali. O maior destes é o suporte para memória DDR2-800 e mais DIMMs por canal. O Shanghai suporta mais DIMMs do que o Barcelona, ou lhe permite ganhar uma velocidade maior com o mesmo número de DIMMs. Cabe ao administrador do server escolher.

Então, agora que você sabe que as diferenças entre os antigos e os novos elementos, o que exatamente está sendo lançado, e quanto vai custar?

São nove chips no total, cinco 2-sockets e quatro 4/8-socket, todos para servidores. A versão com um único socket virá em Q1/2009, provavelmente mais cedo do que tarde.

O modelo para 2-sockets, 2376, virá em 2.3GHz, e subindo de dois em dois números de modelo e de 100MHz para cada um até que chegue no último 2384-2.7GHz. Os modelos 4/8-sockets vão do 8378-2,4GHz ao 8384-2,7GHz.

Custos para os chips de 2 soquetes do 2376 ao 2384 serã no lançamento de U$377, U$523, U$698, U$873 e U$989. Os preços para os chips de 4/8-sockets são de U$1165, U$ 1514, U$ 1865 e U$2149, a partir do 8378 ao 8384. Todos eles devem estar disponíveis a partir de agora, ou em muito pouco tempo.

No final, a AMD parece estar de volta no jogo, não necessariamente uma vencedora claro, mas em situação melhor do que ela estava com o Barcelona.

A AMD têm uma vantagem de uns poucos meses para os chips de 2-sockets do Nehalem, e um ano completo antes dos chips de 4-sockets.

the INQUIRER

:)
Link para o comentário
Compartilhar em outros sites

Reviews:

AMD Shanghai Launch - Database Testing - Anandtech

LINPACK: Intel's Nehalem versus AMD Shanghai - Anandtech

AMD Shanghai 45nm launch - server benchmarks roundup - Technology for Mortals

AMD's 'Shanghai' 45nm Opterons...versus Intel's latest 45nm Xeons - The Tech Report

2x AMD Shanghai vs. Intel nehalem

CPU______________GHz|Socket |Cores|Threads|SPECint_ratebase2006|SPECfp_rate base2006

Intel Nehalem i7-965 3.2__1______4_____8________117__________________82.9

AMD Shanghai 2384_ 2.7__2______4_____8________113__________________105

Technology for Mortals

SPECint_rate2006 (base/peak) SPECfp_rate2006 (base/peak)

Shanghai 2.7GHz (2384, 2S) 113/136 105/118

Shanghai 2.7Ghz (8384, 4S) 202/249 188/210

Barcelona 2.5Ghz (2360, 4S) 92/106 83/90

Barcelona 2.5Ghz (8360, 4S) 169/197 153/170

Harpertown 3.2Ghz (X5482, 2S) 145/156 86/93

Harpertown 2.66Ghz (E5430, 2S) 119/129 69/74

Dunnington 2.66Ghz (X7460, 2S) 144/158 74/78

Dunnington 2.66GHz (X7460, 4S) 267/290 141/154

Maior n° é melhor. fudzilla

:)

:D

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Dentro de alguns dias saem os benchmarks oficiais, mas pra dar um gostinho:

Com dois soquetes no SpecJBB o Shangai a 2.7GHz é mais ou menos 50% mais rápido que o Barcelona a 2.5GHz, batendo inclusive o Xeon a 3.33GHz.

Com quatro soquetes e 16 núcleos ao todo o Shangai bate o Dunnington com seus 24 núcleos.

Com oito soquetes ele xinga a mãe do Power6, como faltam resultados da IBM com o x3950 a disputa terá que esperar.

Esse benchmark é um dos poucos orientados a servidores onde os Xeon tinham uma vantagem significativa, o ganho é devido principalmente ao aumento do cache compartilhado.

Em outros benchmarks onde os Barcelona já possuem um bom resultado contra os Xeons não da para esperar ganhos tão altos.

Link para o comentário
Compartilhar em outros sites

Dentro de alguns dias saem os benchmarks oficiais, mas pra dar um gostinho:

Com dois soquetes no SpecJBB o Shangai a 2.7GHz é mais ou menos 50% mais rápido que o Barcelona a 2.5GHz, batendo inclusive o Xeon a 3.33GHz.

Com quatro soquetes e 16 núcleos ao todo o Shangai bate o Dunnington com seus 24 núcleos.

Com oito soquetes ele xinga a mãe do Power6, como faltam resultados da IBM com o x3950 a disputa terá que esperar.

Esse benchmark é um dos poucos orientados a servidores onde os Xeon tinham uma vantagem significativa, o ganho é devido principalmente ao aumento do cache compartilhado.

Em outros benchmarks onde os Barcelona já possuem um bom resultado contra os Xeons não da para esperar ganhos tão altos.

E os pró-Intel dizendo que iria ser o fim da supremacia da AMD nos servidores com o Nehalem :cool: ,até pode ser mas com os resultados que eu vi mais os que você viu não será tão fácil assim.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

@jonasnoia:

Hmm, é bom citar as fontes também. Só pra não fugir do padrão.:)

@XITA: Acho que ficaria melhor lá no tópico do Barcelona mesmo, aí tipo, deixava o título mais ou menos assim oh: AMD K10 e K10.5. Até porque tem muita informação lá, de coisa que ainda está por vir daqui um bom tempo como o Sao Paulo e etc.

Fica aí a sugestão. :D

De qualquer forma...

AMD partindo para os 32nm no fim de 2009/início de 2010?!

http://www.theinquirer.net/gb/inquirer/news/2008/11/11/amd-announces-move-32nm

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Sim e não, achamos melhor deixar dividido para não ter um tópico colossal e que fique desatualizado na maioria de suas mensagens.

Hmm entendi.

Mas e as especulações além Shangai, Deneb e Socket AM3, como Sao Paulo, Magny Cours, e etc, vão ficar aqui também?

Link para o comentário
Compartilhar em outros sites

AMD partindo para os 32nm no fim de 2009/início de 2010?!

http://www.theinquirer.net/gb/inquirer/news/2008/11/11/amd-announces-move-32nm

Tsk... O cara do The Inquirer entende tanto da indústria que ele ainda acredita que a TSMC vai lançar dielétricos de alto K em 32 nm :). Faz um bom tempo que é 28 nm...

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
MKM a performance de 35% melhor que os Phenom atuais e ainda 30% mais econômico é da própria AMD.

Não, não é. A AMD nunca disse isso (pode procurar se quiser), alias, a AMD não disse uma palavra sobre os Phenom 45nm.

Lembrando que Shangai é diferente de Deneb, apesar dos dois serem o mesmo chip quando se fala de ganhos de um deles é sempre em um conjunto de aplicações, assim ganhos variam muito de um para o outro.

Link para o comentário
Compartilhar em outros sites

Não, não é. A AMD nunca disse isso (pode procurar se quiser), alias, a AMD não disse uma palavra sobre os Phenom 45nm.

Lembrando que Shangai é diferente de Deneb, apesar dos dois serem o mesmo chip quando se fala de ganhos de um deles é sempre em um conjunto de aplicações, assim ganhos variam muito de um para o outro.

Bom a afirmação é deste site qualquer coisa reclame com eles ^_^.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Ummm será que teremos um substituto a altura do Barcelona...(não do CPU e sim do tópico :D).

O Deneb ta me cativando, mas ainda espero mais do Propus.

Dia 13 é amanha, vamos ver o que essas belezinha fazem, já que o mercado server é muito mais lucrativo que o Desktop, então acredito que seja melhor a AMD se concentrar primeiro nele mesmo...

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
MKM a performance de 35% melhor que os Phenom atuais e ainda 30% mais econômico é da própria AMD.

Como o Eduardo comentou aí, isso é mais especulação do que fato.

Ah, e eu não questionei a veracidade dos fatos, só pedi a fonte mesmo, pra deixar como a gente faz no tópico do Barcelona. ^_^

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Mandaram o NDA a @#$%@ e deixaram vazar (mais) um benchmark de novos Opteron, SpecJBB:

4x Opteron 8384 (4 núcleos, 2.7GHz, 95W) - 721,843

4x UltraSPARC T2 Plus (8 núcleos, 1.4GHz, 95?W) - 692,736

4x Xeon X7460 (6 núcleos, 2.66GHz, 130W) - 531,669

4x Power 6 (2 núcleos, 4.7GHz, ?W) - 402,923

4x Opteron 2360 SE (4 núcleos, 2.5GHz, 125W) - 391,654

Com 4 soquetes não teve para ninguem, nem esperaram a segunda onda... Até metade do ano que vem só vai ter Opteron no topo dessa lista mas, para aumentar a emoção vai alguns resultados com 8 soquetes:

8x Power 6 (2 núcleos, 5.0GHz, ?W) - 867,989

8x Opteron 8360 SE (4 núcleos, 2.5GHz, 125W) - 683,542

É, não é todo dia que acontece algo assim, o poderoso Power 6 tremeu nas bases com essa, será que a próxima interação do Shangai bate ele núcleo por núcleo? Façam suas apostas.

ftp://ftp.software.ibm.com/eserver/benchmarks/news/newsblurb_LS42_specjbb_111308.pdf

E para completar, a AMD divulgou o SpecCPU:

SpecInt2006_rate:

2x Opteron 2384 (4 núcleos, 2.7GHz, 95W) - 136

2x Xeon E5450 (4 núcleos, 3GHz, 80W) - 139

2x Opteron 2360 SE (4 núcleos, 2.5GHz, 125W) - 108

Superou o Xeon no mesmo clock, equivalente sobre o mesmo consumo, 16,5% mais rápido que o Barcelona de mesmo clock, nada mal para esse bench.

4x Opteron 8384 (4 núcleos, 2.7GHz, 95W) - 249

4x Xeon E7450 (6 núcleos, 2.4GHz, 80W) - 241

4x Opteron 8360 SE (4 núcleos, 2.5GHz, 125W) - 199

Praticamente o mesmo que o de cima, mas com um detalhe, o Xeon agora tem 50% mais núcleos e por isso melhor performace por clock.

Em performace absoluta a Intel ainda tem o SpecInt.

SpecFp2006_rate:

2x Opteron 2384 (4 núcleos, 2.7GHz, 95W) - 118

2x Power 6 (2 núcleos, 4.7GHz, ?W) - 116

2x Xeon X5482 (4 núcleos, 3.4GHz, 150W) - 95.6

2x Opteron 2356 (4 núcleos, 2.3GHz, 95W) - 94.7

A Intel pode se vangloriar que, durante 40 dias, liderou esse benchmark entre x86s 2P por 1% de diferença, mas agora só quando lançarem o Nehalem.

EDIT: Esqueçam a glória da Intel, vi errado os clocks, tudo que a Intel conseguiu foi fazer seu Xeon de 3.2GHz ser 1% mais rápido que o Opteron 2.3GHz, não é rápido o bastante para o 2.5GHz.

EDIT (de novo): O Xeon era 3.4GHz, to precisando de férias...

4x Power 6 (2 núcleos, 4.7GHz, ?W) - 216

4x Opteron 8384 (4 núcleos, 2.7GHz, 95W) - 210

4x Opteron 8360 SE (4 núcleos, 2.5GHz, 125W) - 170

4x Xeon X7460 (6 núcleos, 2.66GHz, 130W) - 156

Aqui a Intel não pode se vangloriar de nada, e Nehalem nessa arena só na segunda metade de 2009.

Por outro lado a IBM também deve estar preocupada a essa hora...

EDIT: A HP não quis ficar pra trás e entrou na roda também, no SAP-SD:

8x Opteron 8384 (4 núcleos, 2.7GHz, 95W) - 35400 SPAS

Fica difícil uma comparação com outros por causa do software usado, nesse benchmark a combinação Windows+MS SQL costuma ser melhor que a SLES+Oracle usada pela HP, MaxDB e DB2 também se saem bem.

Link para o comentário
Compartilhar em outros sites

EduardoS você colocou vários testes ai no seu post anterior... sendo que entendi 10 de 100% porque, não tenho conhecimento na área de servidores, tanto das siglas usadas tanto das aplicações para quais esses processadores são feitos!

Porém da pra entender a comparação entre os Processadores em alguns casos, mas outros não... Pelo que vi da pra entender que o novo Shangai de 2.7GHz bateu o Xeon de clock mais alto, mas há variantes nas quais eu fiquei na dúvida!

Bom vamos esperar o lançamento de amanhã e os reviews dos outros sites!

Link para o comentário
Compartilhar em outros sites

Mandaram o NDA a @#$%@ e deixaram vazar (mais) um benchmark de novos Opteron, SpecJBB:

4x Opteron 8384 (4 núcleos, 2.7GHz, 95W) - 721,843

4x UltraSPARC T2 Plus (8 núcleos, 1.4GHz, 95?W) - 692,736

4x Xeon X7460 (6 núcleos, 2.66GHz, 130W) - 531,669

4x Power 6 (2 núcleos, 4.7GHz, ?W) - 402,923

4x Opteron 2360 SE (4 núcleos, 2.5GHz, 125W) - 391,654

Com 4 soquetes não teve para ninguem, nem esperaram a segunda onda...

Tremendo resultado, veja que os T2 com suas 32 JVMs e seu sistema muito mais caro perde por uma diferença até razoável... O POWER6 não ganha por muito /núcleo, o Tigerton leva de tábua com 50% de núcleos a mais...

O que que houve? Mudaram a JVM? Ou esse benchmark é muito sensível a cache de último nível?

Até metade do ano que vem só vai ter Opteron no topo dessa lista mas, para aumentar a emoção vai alguns resultados com 8 soquetes:

8x Power 6 (2 núcleos, 5.0GHz, ?W) - 867,989

8x Opteron 8360 SE (4 núcleos, 2.5GHz, 125W) - 683,542

É, não é todo dia que acontece algo assim, o poderoso Power 6 tremeu nas bases com essa, será que a próxima interação do Shangai bate ele núcleo por núcleo? Façam suas apostas.

O 4.7 perde com certeza, o 5.0 GHz pode perder também... Tem que ver se a IBM vai ficar parada, mas acho que não importa: se os G3 escalarem bem pra 8S, o POWER6 terá que ser muito melhor pra competir.

Ah, duvido que os 8S Intel tenham alguma chance... isto é, alguém ainda fabrica um desses?

E para completar, a AMD divulgou o SpecCPU:

Onde?

SpecInt2006_rate:

2x Opteron 2384 (4 núcleos, 2.7GHz, 95W) - 136

2x Xeon E5450 (4 núcleos, 3GHz, 80W) - 139

2x Opteron 2360 SE (4 núcleos, 2.5GHz, 125W) - 108

Superou o Xeon no mesmo clock, equivalente sobre o mesmo consumo, 16,5% mais rápido que o Barcelona de mesmo clock, nada mal para esse bench.

O Xeon tá usando AutoPar e "super-libquantum"? O Opteron usa que compilador (o Xeon já imagino que use ICC com O9 e PGO :))?

4x Opteron 8384 (4 núcleos, 2.7GHz, 95W) - 249

4x Xeon E7450 (6 núcleos, 2.4GHz, 80W) - 241

4x Opteron 8360 SE (4 núcleos, 2.5GHz, 125W) - 199

Praticamente o mesmo que o de cima, mas com um detalhe, o Xeon agora tem 50% mais núcleos e por isso melhor performace por clock.

Mesmas perguntas. Mas agora com menos entusiasmo: SpecIntRate em 4S não é tão "legal"...

Em performace absoluta a Intel ainda tem o SpecInt.

Tem os resultados?

SpecFp2006_rate:

2x Opteron 2384 (4 núcleos, 2.7GHz, 95W) - 118

2x Power 6 (2 núcleos, 4.7GHz, ?W) - 116

2x Xeon X5482 (4 núcleos, 3.4GHz, 150W) - 95.6

2x Opteron 2356 (4 núcleos, 2.3GHz, 95W) - 94.7

A Intel pode se vangloriar que, durante 40 dias, liderou esse benchmark entre x86s 2P por 1% de diferença, mas agora só quando lançarem o Nehalem.

EDIT: Esqueçam a glória da Intel, vi errado os clocks, tudo que a Intel conseguiu foi fazer seu Xeon de 3.2GHz ser 1% mais rápido que o Opteron 2.3GHz, não é rápido o bastante para o 2.5GHz.

Quem diria, x86 ganhando de RISC com várias vezes a largura de banda no SpecFPRate...

EDIT (de novo): O Xeon era 3.4GHz, to precisando de férias...

A Intel que tá apelona :)...

4x Power 6 (2 núcleos, 4.7GHz, ?W) - 216

4x Opteron 8384 (4 núcleos, 2.7GHz, 95W) - 210

4x Opteron 8360 SE (4 núcleos, 2.5GHz, 125W) - 170

4x Xeon X7460 (6 núcleos, 2.66GHz, 130W) - 156

Aqui a Intel não pode se vangloriar de nada, e Nehalem nessa arena só na segunda metade de 2009.

Droga, a escalabilidade ainda não é do POWER6... bom, acho que dá pra cumprimentar por conseguirem com várias vezes menos área, consumo e largura de banda :).

Por outro lado a IBM também deve estar preocupada a essa hora...

Acho que logo eles lançam POWER6 de 45 nm, além do mais eles tem muitos truques na manga ainda... mas eles tão meio feios por enquanto: Opteron 45 nm vs POWER6 65 nm era pra ser mais pro POWER nesses benchmarks (principalmente nos FP).

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
EduardoS você colocou vários testes ai no seu post anterior... sendo que entendi 10 de 100% porque, não tenho conhecimento na área de servidores, tanto das siglas usadas tanto das aplicações para quais esses processadores são feitos!

Citei três benchmarks aqui:

- SpecJBB: Esse benchmark mede o desempenho de um servidor de aplicação (um servidor com uma porrada de classes "home made" que serve muitos outros servidores da empresa) Java, existe alguns problemas nesse teste que fazem ele não ser 100% fiel à utilização real, mas ele é muito popular por ser fácil de configurar e rodar, o Barcelona e mesmo o K-8 tinham um resultado muito ruim nesse teste, grande parte por causa do cache pequeno, mas o Shangai humilhou todo mundo.

- SpecInt: Não é exatamente um teste para servidores, mas sim para workstations, ele mede o desempenho de aplicações com inteiros, compiladores, compactadores, etc, o Xeon ficou mais rápido em relação a performace absoluta, mas sob a mesma dissipação térmica o Shangai e os Xeons ficaram empatados.

- SpecFp: Que nem o de cima, mas com aplicações de ponto flutuante, banda de memória é muito importante aqui por isso o FSB dos Xeons não tem a menor chance, eles mal competiam com os Barcelona.

Esses Xeons não são os com a mesma arquitetura do Nehalem né?

Não, o Nehalem só será lançado ano que vem, início do ano para a versão 2P e segunda metade para a versão 4P.

O que que houve? Mudaram a JVM? Ou esse benchmark é muito sensível a cache de último nível?

A JVM é da IBM, eles trabalharam duro e ela ficou muito boa, deve ser responsável por 20% desse resultado, o resto é culpa da AMD mesmo, não só o aumento do cache mas também a melhora de todo o subsitema de memória, algumas otimizações no núcleo devem ter contribuído também.

Já sabia que o ganho no JBB seria grande, mas não esperava essa carta (er... bazuca) na manga da IBM.

Ah, duvido que os 8S Intel tenham alguma chance... isto é, alguém ainda fabrica um desses?

IBM e mais alguns 2nd tier.

O Xeon tá usando AutoPar e "super-libquantum"? O Opteron usa que compilador (o Xeon já imagino que use ICC com O9 e PGO :))?

Com certeza :devil:, quando tiver mais tempo posso olhar melhor os resultados da Intel.

O compilador do Opteron é o PGI 7.2

Link para o comentário
Compartilhar em outros sites

- SpecInt: Não é exatamente um teste para servidores, mas sim para workstations, ele mede o desempenho de aplicações com inteiros, compiladores, compactadores, etc, o Xeon ficou mais rápido em relação a performace absoluta, mas sob a mesma dissipação térmica o Shangai e os Xeons ficaram empatados.

Detalhe importante sobre esse teste: ele tem várias aplicações, todas tem código fonte distribuído e são compiladas com compiladores e opções "excitantes": não é a realidade de servidores ou aplicativos comerciais, é um teste de aplicações para estações de trabalho mais "acadêmicas" que pode ser estendido para aplicações de estação de trabalho mais comerciais, se você analisar aplicação a aplicação.

Enfim, é mais pra analisar que pra considerar mesmo. Como todo benchmark, na verdade... Ele até poderia dar alguma ideia de performance em inteiros no geral, mas a comparação tem de ser bem feita, muitas vezes alguém quebra algum bench e sai surfando...

A JVM é da IBM, eles trabalharam duro e ela ficou muito boa, deve ser responsável por 20% desse resultado, o resto é culpa da AMD mesmo, não só o aumento do cache mas também a melhora de todo o subsitema de memória, algumas otimizações no núcleo devem ter contribuído também.

É, vi alguns resultados que saíram no RWT e a JVM da IBM entrou com tudo na briga...

Mesmo assim o Shangai fez mágica nesse benchmark, mostrou que para algumas aplicações os 6 MiB de cache e as outras melhorias vão fazer diferença mesmo...

Já sabia que o ganho no JBB seria grande, mas não esperava essa carta (er... bazuca) na manga da IBM.

Que aliás vai contra ela mesma, de certa forma... é a IBM mesmo.

IBM e mais alguns 2nd tier.

Pois é, a IBM tem até 16S/96C (achei que só teria até 16S/32C, ou 16S/64C) a Unisys acho que continua no mercado, e tal... mas com os Opterons você não precisa investir muito em desenvolvimento de chipset, com os Intels você vai ter de investir E competir com a IBM: não bom :).

Com os Nehalems, isso muda um pouco, mas não tanto. Mesmo porque atualmente não existem produtos 4S Intel, e agora com essa mudança de plataforma e uma interconexão complexa como a QPI...

Com certeza :devil:, quando tiver mais tempo posso olhar melhor os resultados da Intel.

Quando tiver tempo... posso ler seus comentários :).

O compilador do Opteron é o PGI 7.2

Acho que atualmente é o melhor compilador para o Opteron, não? Ninguém testou ele pra Intel? Talvez a própria Portland? Dependendo do resultado e do preço/condições de licenciamento eles podem conseguir bastante coisa no mercado de computação científica com dinheiro... todas as cinco licenças, daria um gás pra empresa :).

Link para o comentário
Compartilhar em outros sites

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...