Ir ao conteúdo
  • Cadastre-se

AMD Jaguar - Kabini/Temash - Tópico oficial


Torrente

Posts recomendados

Apresentado recentemente no simpósio Hot Chips o AMD Jaguar

O Jaguar será sucessor do bobcat e ao que tudo indica já será fabricado pela Global Foundries em processo de 28nm, em um formato APUs SoC (system-on-a-chip)

Ele será usado nas plataformas "Kabini" e "Temash" com foco no baixo consumo.

- APU Temash ULP: 2 Jaguar cores

- APU Kabini: 2 ou 4 Jaguar cores

Temash e Kabini serão SoC com integração FCH.

Irão utilizar soluções gráficas baseadas em GCN ( rumores indicam ser da série HD 8000)

Entre suas melhorias destaca-se o acrescento de instruções antes disponíveis apenas em seus irmãos High-end tais como SSE4.1/SSE4.2/AVX

33.jpg

Outro detalhe é o cache compartilhado.

32.jpg

Há uma grande chance de que esta geração de chips vir com suporte PCIe 3.0

Especula-se lançamento para Q2/2013

http://pc.watch.impress.co.jp/docs/column/kaigai/20120831_556374.html

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Em sua construção são empregados alguns aspectos de arquitetura dos BDZ, tais como cache compartilhado.

O compartilhamento de cache no Bulldozer é bem diferente... O L2 do Jaguar está mais para o L3 dos Sandy Bridge.

ps: Melhor nem mencionar Bulldozer nesse tópico, não há semelhanças entre os dois projetos.

Link para o comentário
Compartilhar em outros sites

Eu fiquei surpreso com o jaguar, parece bastante promissor.

Eduardo, no outro topico você postou que o FP é apenas a cereja do bolo (para mim FP foi o sinal de que a AMD esta investindo bastante no jaguar para o futuro, pois a unidade de 128bits não me parece ser uma necessidade para o mercado do jaguar), então me pergunto, que parte do que ja foi anunciado lhe chamou mais a atenção? =)

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Eduardo, no outro topico você postou que o FP é apenas a cereja do bolo (para mim FP foi o sinal de que a AMD esta investindo bastante no jaguar para o futuro, pois a unidade de 128bits não me parece ser uma necessidade para o mercado do jaguar), então me pergunto, que parte do que ja foi anunciado lhe chamou mais a atenção? =)

O scheduller, a unidade load/store, buffers internos em geral e tudo isso aumentando o clock.

128 bits hoje é quase um prerequisito, muitos codecs usam, no Bobcat a performance DP era muito baixa, apenas uma multiplicação a cada dois ciclos, dependendo de como esses 128 bits foram implementados o Jaguar pode ganhar a capacidade de fazer duas multiplicações escalares DP por ciclo, o que seria um grande avanço.

Link para o comentário
Compartilhar em outros sites

O scheduller, a unidade load/store, buffers internos em geral e tudo isso aumentando o clock.

128 bits hoje é quase um prerequisito, muitos codecs usam, no Bobcat a performance DP era muito baixa, apenas uma multiplicação a cada dois ciclos, dependendo de como esses 128 bits foram implementados o Jaguar pode ganhar a capacidade de fazer duas multiplicações escalares DP por ciclo, o que seria um grande avanço.

Tipo, "para quê DP para o mobile?" E "não vale mais a pena ter uma unidade de função-fixa para trabalhar com midia, reduzindo o consumo?"

Essas mudanças me levam a crer que a AMD quer que o Jaguar acabe saindo do nicho dele (se bem que ele já mal se encaixava nesse nicho). Foi isso que eu quis dizer.

E um comentario, a RCM parece ser bem mais adequado para os "bobcats" que os "BDZs", não existe info que o Jaguar a use, mas quem sabe no próximo?

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Tipo, "para quê DP para o mobile?" E "não vale mais a pena ter uma unidade de função-fixa para trabalhar com midia, reduzindo o consumo?"

Uma unidade de função fixa para jpeg, gif, mp3, etc? Não da para ter função fixa para tudo, no máximo se coloca para os mais exigentes, mas ha diversos outros tipos de codecs rodando no PC, não necessariamente que precisam de grande desempenho mas rodam, e usando SSE (128 bits), ter unidades assim significa executar esse código gastando menos energia e, nos raros casos onde o desempenho deles impactar (imagine uma pagina web com milhares de imagens), mais rápido.

Essas mudanças me levam a crer que a AMD quer que o Jaguar acabe saindo do nicho dele (se bem que ele já mal se encaixava nesse nicho). Foi isso que eu quis dizer.

Continua no nicho dele e, se quer saber, ele se encaixa muito bem nesse nicho, o único risco é ele ficar bom demais e avançar para o nicho do Bulldozer, mas não da para dizer que uma CPU com 3,1mm² não serve para mobile e até smartphones...

E um comentario, a RCM parece ser bem mais adequado para os "bobcats" que os "BDZs", não existe info que o Jaguar a use, mas quem sabe no próximo?

RCM só funciona quando o clock é bem alto (a parte "ressonant" depende disso) e onde a distribuição do clock consome uma parte significativa do consumo total, o Bobcat não atinge clock alto nem com 2V, o Jaguar atinge clocks mais altos mais ainda não chega nesse ponto e em nenhum desses dois a distribuição do clock consome muito, o próprio Bulldozer só se beneficia acima dos 3GHz.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Uma unidade de função fixa para jpeg, gif, mp3, etc? Não da para ter função fixa para tudo, no máximo se coloca para os mais exigentes, mas ha diversos outros tipos de codecs rodando no PC, não necessariamente que precisam de grande desempenho mas rodam, e usando SSE (128 bits), ter unidades assim significa executar esse código gastando menos energia e, nos raros casos onde o desempenho deles impactar (imagine uma pagina web com milhares de imagens), mais rápido.

Justo, se 128bits realmente impactar tanto assim ("race to idle" vem a mente, é a isso que você se refere?) eu até fico quieto. Quando você falou codec me veio a mente apenas video (HD e tal), para isso função-fixa tá quase virando regra esses dias.

(E aquelas frases entre as aspas erma só exemplos do que vem a mente, não estava sugerindo ter função-fixa para tudo (_()

Continua no nicho dele e, se quer saber, ele se encaixa muito bem nesse nicho, o único risco é ele ficar bom demais e avançar para o nicho do Bulldozer, mas não da para dizer que uma CPU com 3,1mm² não serve para mobile e até smartphones...

Quando falei não se encaixa no nicho eu tava pensando em smartphones e tablets (o bobcat mal se encaixa nesse nicho, ainda consome demais). Realmente para laptops de entrada ele é muito bom mesmo tanto que vendeu que nem pastel em feira e "salvou" a AMD. Erro meu por n ter sido claro.

E sim, é a esse "risco de invadir o nicho do BDZ" que eu me refiro.

(não que eu ache ruim, só me surpreendeu positivamente)

RCM só funciona quando o clock é bem alto (a parte "ressonant" depende disso) e onde a distribuição do clock consome uma parte significativa do consumo total, o Bobcat não atinge clock alto nem com 2V, o Jaguar atinge clocks mais altos mais ainda não chega nesse ponto e em nenhum desses dois a distribuição do clock consome muito, o próprio Bulldozer só se beneficia acima dos 3GHz.

Hmm, eu imaginava que em torno de 2GHz já faria um efeito benéfico, o bobcat já tá em 1.65GHz, coloca o shrink, tira alguma eventual falta de experiencia com 28nm, soma as mudanças feitas para aumentar o clock... acho que 2Ghz é até possível, n?

(Mas entendo que a maior parte dos SKUs poderão ter clock menor e por isso o RCM não valeria a pena no final.)

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Justo, se 128bits realmente impactar tanto assim ("race to idle" vem a mente, é a isso que você se refere?) eu até fico quieto.

Ah sim, é a tal da "race to idle", mas que também pode ser "executar em clock menor e menos tensão" que é ainda mais econômico.

E não é questão de fazer tanta diferença assim, faz um pouco de diferença e o custo é baixo, e hoje o uso de SSE é BEM mais comum que na era do Athlon 64.

Quando falei não se encaixa no nicho eu tava pensando em smartphones e tablets (o bobcat mal se encaixa nesse nicho, ainda consome demais). Realmente para laptops de entrada ele é muito bom mesmo tanto que vendeu que nem pastel em feira e "salvou" a AMD.

O problema do Bobcat não é o Bobcat em si, é a GPU que é grande e beberrona demais, a CPU é um pouco demais para um smartphone mas caberia em um tablet, e o concorrente dele seria o A9.

Um die shrink muda as coisas:

1) O concorrente dele não é mais o A9, é o A15;

2) O núcleo ficou menor e mais econômico;

3) A GPU também ficou menor e mais econômica;

4) Acho que o Jaguar tem um tamanho comparável ao A15.

Enfim, o Jaguar já é pequeno o bastante para embarcar em smartphones, claro, o chip não é só CPU, é um SoC e o resto faz diferença, mas a CPU tem essa capacidade.

Hmm, eu imaginava que em torno de 2GHz já faria um efeito benéfico, o bobcat já tá em 1.65GHz, coloca o shrink, tira alguma eventual falta de experiencia com 28nm, soma as mudanças feitas para aumentar o clock... acho que 2Ghz é até possível, n?

Acho que o próprio Bobcat poderia passar dos 2GHz, pro Jaguar em 28nm acho que o limite fica nos 2.5GHz, mas isso com muita tensão e pouca eficiência energética, o Jaguar só tem razão para existir se for mais eficiente que o Steamroller, isso limita a tensão "comercial" dele.

(Mas entendo que a maior parte dos SKUs poderão ter clock menor e por isso o RCM não valeria a pena no final.)

Bolão? Chuto que o SKU mais rápido terá clock de 1.8GHz, mas os SKUs que realmente vão chamar a atenção terão clock base de 1GHz e TDP menor que 5W.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Ah sim, é a tal da "race to idle", mas que também pode ser "executar em clock menor e menos tensão" que é ainda mais econômico.

Fazendo referencia a design de GPU, seria usar um die maior com clock e tensão menores.

A analogia não fica lá muito correta, não é como se desse para fazer simplesmente um "núcleo de CPU maior" da mesma forma que se pode fazer uma GPU "com mais shaders". Mas dá para entender, em termos de CPU seria ter especificações "conservadoras" de performance e otimizar pelo consumo (exatamente o foco do bobcat).

O problema do Bobcat não é o Bobcat em si, é a GPU que é grande e beberrona demais, a CPU é um pouco demais para um smartphone mas caberia em um tablet, e o concorrente dele seria o A9.

Suponho que a GPU do BCT seja VLIW5, ninguém falou ainda da GPU do Kabini. É provável que saia GCN. Se sim vai ser um senhor salto de performance com a mesma TDP.

(Acho que o "BCT com VLIW4" seria Krishna/Wichita.)

Enfim, o Jaguar já é pequeno o bastante para embarcar em smartphones, claro, o chip não é só CPU, é um SoC e o resto faz diferença, mas a CPU tem essa capacidade.

A TDP ainda está grande demais para smartphone. "Dá para colocar?" Dá sim, mas não seria lá essa coisa toda, a bateria iria voar rapidinho... Eu não compraria. -_-

Bolão? Chuto que o SKU mais rápido terá clock de 1.8GHz, mas os SKUs que realmente vão chamar a atenção terão clock base de 1GHz e TDP menor que 5W.

Segundo o que o Dragum trouxe é basicamente com esse número que a AMD trabalha, mas pelo fato da AMD estar mais conservadora nas previsoes e pelo sinal usado (">"), parece que 10% é o mínimo. Por isso acho que sai 1.9~ como TOP SKU, ou uns 1.85 (o que eu consideraria um acerto seu).

Uma coisa que eu gostei foi:

slide-1-728.jpg

90% instruções por clock (CPU) contra mainstream (Trinity?) + 15% > 100% (Melhor que Trinity?)...

Isso não ta parecendo os Pentium M e Core Duo?

Mainstream = Athlon II.

E são +15% de IPC e +10% de clock, fica ainda mais redondinho. ^_^

Link para o comentário
Compartilhar em outros sites

Isso não ta parecendo os Pentium M e Core Duo?

Desempenho de Pentium M/CoreDuo num chip voltado para tablets e netbooks x86? Parece promissor para mim! Vai ser um verdadeiro esmagador de Atom pelo visto...

E são +15% de IPC e +10% de clock, fica ainda mais redondinho. ^_^

Isso parece uma evolução bastante decente para mim. Vamos ver se vai dar certo mesmo!

Curiosidade: esse Jaguar é baseado na antiga arquitetura do Athlon/Phenom ou na nova dos FX?

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Fazendo referencia a design de GPU, seria usar um die maior com clock e tensão menores.

Não é bem isso... Visando um consumo ultra-baixo o tamanho do die acaba ficando muito limitado.

Suponho que a GPU do BCT seja VLIW5, ninguém falou ainda da GPU do Kabini. É provável que saia GCN. Se sim vai ser um senhor salto de performance com a mesma TDP.

(Acho que o "BCT com VLIW4" seria Krishna/Wichita.)

O Bobcat é VLIW5, o Jaguar vem com GCN, que eu saiba VLIW4 nunca será usado nesse segmento.

A TDP ainda está grande demais para smartphone. "Dá para colocar?" Dá sim, mas não seria lá essa coisa toda, a bateria iria voar rapidinho... Eu não compraria. -_-

Isso depende de como o SoC for feito ;-)

Desempenho de Pentium M/CoreDuo num chip voltado para tablets e netbooks x86? Parece promissor para mim! Vai ser um verdadeiro esmagador de Atom pelo visto...

A título de curiosidade, um Pentium M feito em 28nm ficaria mais ou menos do mesmo tamanho do Jaguar.

Curiosidade: esse Jaguar é baseado na antiga arquitetura do Athlon/Phenom ou na nova dos FX?

O Jaguar é uma evolução do Bobcat que foi uma arquitetura criada do zero pela AMD, respondendo sua pergunta, nem Athlon/Phenom e nem FX :lol:

Link para o comentário
Compartilhar em outros sites

A título de curiosidade, um Pentium M feito em 28nm ficaria mais ou menos do mesmo tamanho do Jaguar.

Será que o consumo ficaria bom? Se sim seria uma boa pedida a Intel ressuscitá-lo das cinzas para enterrar o Atom, pois o Pentium M, apesar de antigo, é mais decente que Atom. Fora que a Intel podia fazê-lo em 22nm, que ficaria mais interessante que 28nm. Um CoreDuo no lugar de um Atom DualCore seria filé demais, se o consumo ficasse interessante.

O Jaguar é uma evolução do Bobcat que foi uma arquitetura criada do zero pela AMD, respondendo sua pergunta, nem Athlon/Phenom e nem FX :lol:

Obrigado pelo esclarecimento. Eu achava que o Bobcat fosse baseado no Athlon 64, embora com diversas modificações, para otimizar para baixo consumo e tudo mais...

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Será que o consumo ficaria bom? Se sim seria uma boa pedida a Intel ressuscitá-lo das cinzas para enterrar o Atom, pois o Pentium M, apesar de antigo, é mais decente que Atom. Fora que a Intel podia fazê-lo em 22nm, que ficaria mais interessante que 28nm. Um CoreDuo no lugar de um Atom DualCore seria filé demais, se o consumo ficasse interessante.

A pergunta é, se a Intel quer recussitar o Core 2 Duo, o Pentium M era 32 bits e SSE muito lenta, não impressionaria hoje, o Core 2 Duo talvez, mas um Ivy Bridge com um núcleo deve ser mais rápido e consumir menos, com pouca tensão e 1GHz qual será a TDP? Depende mais da vontade da Intel matar o Atom.

Link para o comentário
Compartilhar em outros sites

A pergunta é, se a Intel quer recussitar o Core 2 Duo, o Pentium M era 32 bits e SSE muito lenta, não impressionaria hoje, o Core 2 Duo talvez, mas um Ivy Bridge com um núcleo deve ser mais rápido e consumir menos, com pouca tensão e 1GHz qual será a TDP? Depende mais da vontade da Intel matar o Atom.

É! Faz sentido. A Intel podia pegar e fazer um Ivy Bridge com menos cache, clocks mais baixos e modelos de um ou dois núcleos (com HT) e matar o Atom. O consumo era capaz de ficar pouca coisa maior que o Atom, mas com uma performance incrivelmente maior. Mas duvido que ela faça isso agora. Eu li em algum lugar aqui no fórum (acho que foi no tópico do Atom) que o Atom baseado na arquitetura do Ivy Bridge virá só em 2015, com litografia menor (16nm?) e com uma performance similar aos Phenom II de desktop, uma marca até boa para o segmento dele. Eu só falei em ressuscitar o Pentium M/CoreDuo porque ele tinha bem menos transístores que os sucessores dele, o que numa litografia atual seria um chip pequeno e com consumo interessante. Mas se fosse necessário, faria algumas modificações no chip, como o suporte a instruções SSE e AVX mais recentes e suporte a 64 bits. Não deve ser muito difícil fazer algo melhor que o Atom, né? Ainda mais com o potencial da Intel...

Link para o comentário
Compartilhar em outros sites

É! Faz sentido. A Intel podia pegar e fazer um Ivy Bridge com menos cache, clocks mais baixos e modelos de um ou dois núcleos (com HT) e matar o Atom. O consumo era capaz de ficar pouca coisa maior que o Atom, mas com uma performance incrivelmente maior. Mas duvido que ela faça isso agora. Eu li em algum lugar aqui no fórum (acho que foi no tópico do Atom) que o Atom baseado na arquitetura do Ivy Bridge virá só em 2015, com litografia menor (16nm?) e com uma performance similar aos Phenom II de desktop, uma marca até boa para o segmento dele. Eu só falei em ressuscitar o Pentium M/CoreDuo porque ele tinha bem menos transístores que os sucessores dele, o que numa litografia atual seria um chip pequeno e com consumo interessante. Mas se fosse necessário, faria algumas modificações no chip, como o suporte a instruções SSE e AVX mais recentes e suporte a 64 bits. Não deve ser muito difícil fazer algo melhor que o Atom, né? Ainda mais com o potencial da Intel...

^_^ Por mim prefiro que ela so venho com Atom ( Ivy 16 nm ?? ) em 2015 mesmo e deixe os Jaguar mostrar a que veio ( por favor AMD nada de Fail a la BDZ nos Jaguar por favor. )

Link para o comentário
Compartilhar em outros sites

Bolão? Chuto que o SKU mais rápido terá clock de 1.8GHz, mas os SKUs que realmente vão chamar a atenção terão clock base de 1GHz e TDP menor que 5W.

^_^ Não duvido nada, por sinal o Temash indica que ira iniciar em 3.6W.

Referente o slide a seguir na faixa de 15W a 25W ficaria a escolha entre uma solução Kabini ( jaguar) ou Kaveri ( Steamroller)

34t9uth.jpg

Link para o comentário
Compartilhar em outros sites

  • 2 meses depois...
  • 4 semanas depois...

Rumores a cerca dos processadores a serem lançados pros futuros consoles da Sony e Microsoft. Dizem que eles seriam equipados com os futuros Jaguar, sucessor do Bobcat:

http://www.eurogamer.pt/articles/2013-01-17-apelo-as-especificacoes-o-que-esperar-das-proximas-consolas

Parece que seria o Kabini a versão do Jaguar pros consoles, mas com 8 em vez de 4 núcleos. Mesmo assim, será que esse Jaguar supriria a demanda de poder pros consoles da nova geração? Ou é pouca coisa? E será que tais consoles virão com uma VGA adicional? Uma Radeon 8310G já daria conta do recado? Acho que seria mais vantagem se fosse um Trinity A10, como vinha sendo falado, antes.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Não é bem uma novidade, é? http://forum.clubedohardware.com.br/showpost.php?p=5816809&postcount=1885

O núcleo do Jaguar é bem pequeno, podiam colocar 16 se quisessem, vai ver não acharam utilidade para os outros 8, e se aumentaram o número de núcleos da CPU por que não aumentariam o número de núcleos da GPU? Cabe uma HD7870 ali, o que vai limitar é o consumo mesmo, uns 960sps cabem direitinho ali em termos de custo e consumo.

Sem querer ser chato mas repetindo mais uma vez, o Jaguar corre o risco de ficar melhor que o Bulldozer...

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Se conseguirem um desempenho no Jaguar melhor do que o do Bulldozer em todos os mercados, então o Bulldozer e seus descendentes serão só mais um elo perdido...

Mas o Jaguar não é um chip projetado para computação móvel, visando perf/W em vez de priorizar alto desempenho single-thread?

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...