Tachyumin universaali Prodigy-prosessori läpäisi x86-, ARM- ja RISC-V-emulaatiotestit

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
19 597


Kaotik kirjoitti uutisen/artikkelin:
Tachyum on ainakin toistaiseksi monille täysin tuntematon nimi. Mikäli yhtiön tavoitteet toteutuvat, se tulee kuitenkin muuttumaan ensi vuonna Prodigy-prosessoreiden myötä.

Tachyum Prodigy on yhtiön omaan käskykanta-arkkitehtuuriin perustuva prosessori, jonka luvataan olevan niin sanotusti ”universaali prosessori” siinä mielessä, että se kykenee suorittamaan natiivien sovellusten lisäksi ainakin x86-, ARM- ja RISC-V-sovelluksia. Yhtiön tuoreen lehdistötiedotteen mukaan sen läpäisseen onnistuneesta ohjelmistopohjaisen emulaation kaikilla kolmella käskykannalla (ISA, Instruction Set Architecture).

Tachyumin tavoite on luonnollisesti saada yritykset ajamaan sen prosessoreille natiivia koodia, mutta siirtymävaiheessa muiden käskykanta-arkkitehtuurien tuki on ensiarvoisen tärkeää. Yhtiön tiedotteen mukaan sen Prodigy-prosessori suorittaakin ainakin ARM- ja RISC-V-käskykantoja nopeammin, kuin kyseisiä käskykantoja natiivisti ajavat prosessorit.

[embed]
Yhtiön mukaan sen on tarkoitus toimittaa ensi vuonna Prodigy-prosessoreiden julkaisun yhteydessä natiivi Linux-jakelu, joka sisältää käyttäjälle näkymättömän emulaattorin, joka kääntää x86-, ARM- ja RISC-V -koodin lennossa Prodigyn ISA:lle. Tachyum on myös julkaissut sivuillaan videoita, joissa emulaation näytetään toimivan ongelmitta.

Tachyumin prosessorit on suunnattu palvelimiin ja lehdistötiedotteen mukaan ne ovat nykyisiä Xeon-prosessoreita nopeampia 10 kertaa pienemmällä tehonkulutuksella, kun kumpikin ajaa itselleen natiivia koodia. Prodigy-lippulaivamallin kerrotaan olevan myös nopeampi, kuin NVIDIAn nopein GPU HPC-tehtävissä, tekoälyopetuksessa ja päättelytehtävissä (inference).

Tulemme io-techin toimituksessa seuraamaan Prodigyn kehitystä ja odotamme mielenkiinnolla kolmansien osapuolten testejä, jotka tulevat lopulta osoittamaan pitävätkö Tachyumin lupaukset paikkansa, vai eivät.

Lähde: Tachyum

Linkki alkuperäiseen juttuun
 
Liittynyt
27.12.2016
Viestejä
850
Haisee kyllä markkinointi BS noista lupauksista, liian hyvää ollakseen totta.
Just ovat saaneet emulaation toimimaan ja samantien käsissä on jeesuspiiri joka voittaa kilpailijoiden prosessorit ja näyttikset suoraan...

Edit:
Oma veikkaus: Tuo Xeon vertaus on tehty tekoälykuormalla (tai muulla erikoiskuormalla) johon niiden omassa käskykannassa on spessukäskyjä joita xeonilta ei löydy, ja nVidiaa vastaan vertauksessa mennään virrankulutuksessa reilusti ohi kun siitä ei mitään mainintaa.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
2 103
Transmeta v.2?

Vaikka prosessori ajaisi itselleen natiivia koodia nopeammin ja pienemmällä tehonkulutuksella kuin Xeon, niin markkinoille päästäkseen pitäisi kuitenkin ajaa nykysovelluksia absoluuttisesti nopeammin tai ainakin energiatehokkaammin kuin se Xeon. Ja vaikka teknologia olisikin sinänsä pätevää ja lupaukset täytettäisiin, niin pitäisi onnistua jostain haalimaan tarpeeksi tuotantokapasiteettia että saisi mitään merkittäviä toimitussopimuksia tehtyä. Veikkaan että jää marginaalituotteeksi joka unohdetaan 2 vuoden sisällä ja sitten joku isompi toimija ostaa patentit pois kuljeksimasta.
 
Viimeksi muokattu:
Liittynyt
22.10.2016
Viestejä
9 832
Jotain tarkempia tietoja tästä löytyy tuolta:



nextplatform.com sanoi:
The processor pipeline has its out of order execution handled by the compiler, not by hardware, so there is some debate about whether this is an in order or out of order processor.
Ei siinä ole mitään "debatablea", se on selvästi in-order-prosessori.

Kun tulee välimuistihuti, tuolla koko ydin stallaa, siinä missä out-of-order-prossu jatkaa sellaisten käskyjen suorittamista, jotka ei riipu siitä stallanneesta latauksesta.

Ja silloin kun tuon binäärikääntäjä ei onnistu sw-pipelinettämään looppia, sillä on käytössään vain hyvin vähän käskytason rinnakkaisuutta ja se tuottaa todella hidasta koodia, siinä missä spekulatiivisesti suorittava todellinen OoOE-prosessori ennustaa haarautumisia monta iteraatiota eteenpäin ja suorittaa limittäin koodia monesta iteraatiosta oikein kivalla käskytason rinnakkaisuudella.

Tämä nyt haisee aika pahasti siltä, että tämä pieksee
1) jotain todella pieniä ja mopoja in-order-ARM-ytimiä (esim. Cortex A53 tai A55) ja kaikki RISC-V-ytimet on muutenkin mopoja
2) ehkä järeämpiä ARMeja joissain yksittäisessä yliyksinkertaisessa epärelevantissa benchmarkissa jossa tuon binäärikääntäjä toimii tuurilla täydellisesti ja tuolla on käytössään N kertaa enemmän ytimiä kuin niillä ARM-prossuilla, eli vertailu on muutenkin apples to oranges.

Noiden vertailut energiatehokkuudessa Xeoneihin taas ei perustune mihinkään todellisiin benchmarkkeihin vaan siihen että verrataan vaan teoreettisia flopseja, ja verrataan sellaisiin xeoneihin jotka ei edes yritä olla super-energiatehokkaita vaan pyrkii suurempaan absoluuttiseen suorituskykyyn.

Ja jos tuohon numeronmurskaukseen mennään, niin olen melko varma että esim. Fujitsun ARMv8+SVE-käskykantaa ajavat A64FX-ytimet pieksee tuota suurimmalla osalla tosimaailman workloadeista aika selvästi.


Ainoa oikeasti hyvältä idealta vaikuttava juttu tuossa on tuo että siinä on ilmeisesti 4x4-matriisin outer product-käsky, jolla saadaan tehostettua matriisien kertolaskua selvästi. Mutta tämä on aika merkityksetön silloin kun tällä ajetaan emuloituna jotain muuta käskykantaa, jossa tuollaista käskyä ei löydy.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
18 532
Voi olla kyllä In-Order prosessorilla vaikeaa saada sama suorituskyky. Asiaan vihkiytymättömille: In-Order oli ne vanhat hitaat Atomit.

Ja päästäkseen edes luvattuihin nopeutuksiin niillä täytyy sitten olla h**vetin monta hidasta ydintä, eli käytännössä tässä on ytimiä 10-20x enemmän kuin vertailuprosessoreissa ja sillä pärjäävät benchmarkeissa. Mutta tässä voi olla myös kääntäjäoptimointeja ja hyvin spesifisiä testiskenaarioita, niin oikeassa elämässä nuo on vähän kuin sinulla olisi klusteri, jossa on 50 raspberry pi:tä ja ei sille ole mitään oikeaa käyttöä.
 
Liittynyt
27.12.2016
Viestejä
1 713
Ilman tarkempaa tietoa ISAsta vaikuttaisi siltä kuin Jazelle, IA64 ja OISC olisi olleet viettämässä todella kosteaa iltaa.
 

WanhaPatu

Suurmöyhentäjä
Liittynyt
17.10.2016
Viestejä
1 430
Eikö tuo "10 kertaa pienempi tehonkulutus" ole vähän höpsösti sanottu? Yhden kerran pienempi tehonkulutushan jo tarkoittaisi, että energiaa ei kulu lainkaan.

Voisiko tuon sanoa, että "kymmenkertainen energiatehokkuus" tai "tehonkulutuksen ollessa 1/10 verrattuna kilpailevaan tuotteeseen" tai "90% pienemmällä tehonkulutuksella" tms.
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
19 597
Eikö tuo "10 kertaa pienempi tehonkulutus" ole vähän höpsösti sanottu? Yhden kerran pienempi tehonkulutushan jo tarkoittaisi, että energiaa ei kulu lainkaan.

Voisiko tuon sanoa, että "kymmenkertainen energiatehokkuus" tai "tehonkulutuksen ollessa 1/10 verrattuna kilpailevaan tuotteeseen" tai "90% pienemmällä tehonkulutuksella" tms.
Kun sitä ei valitettavasti tiedä mitä tarkalleen valmistaja milloinkin sillä tuntuu tarkoittavan, ellei se julkaise tarkkoja lukuja. Typerä ilmaisu, siitä olen samaa mieltä, mutta kun ei tarkempaa tietoa ole on "pakko" käyttää sitä.
 
Liittynyt
04.06.2020
Viestejä
78
Haisee kyllä markkinointi BS noista lupauksista, liian hyvää ollakseen totta.
Just ovat saaneet emulaation toimimaan ja samantien käsissä on jeesuspiiri joka voittaa kilpailijoiden prosessorit ja näyttikset suoraan...

Edit:
Oma veikkaus: Tuo Xeon vertaus on tehty tekoälykuormalla (tai muulla erikoiskuormalla) johon niiden omassa käskykannassa on spessukäskyjä joita xeonilta ei löydy, ja nVidiaa vastaan vertauksessa mennään virrankulutuksessa reilusti ohi kun siitä ei mitään mainintaa.
Tachyonin mukaan :
Outperforms Xeon on SpecInt & SpecFP 2006 benchmarks
• One 3.5GHz Xeon E5-2687W v4 core vs one Prodigy core, same GCC 7.2


Vähän kyllä kuulostaa liian hyvältä ollakseen totta tämä Tachyum.
 

WanhaPatu

Suurmöyhentäjä
Liittynyt
17.10.2016
Viestejä
1 430
Kun sitä ei valitettavasti tiedä mitä tarkalleen valmistaja milloinkin sillä tuntuu tarkoittavan, ellei se julkaise tarkkoja lukuja. Typerä ilmaisu, siitä olen samaa mieltä, mutta kun ei tarkempaa tietoa ole on "pakko" käyttää sitä.
Tai sitten jätetään pelivaraa sanomalla, että "väitetysti pienemmällä tehonkulutuksella" tms.
 
Liittynyt
23.08.2017
Viestejä
221
Tästä tulee mieleen kun Kiinassa julkaistiin parisen vuotta sitten ensimmäinen täysin kiinalaisten omin voimin tehty selain korvaamaan länsimaiset. Selaimen "kehittänyt" firma oli saanut ihan valtioltakin tukea. Alkuun oli kovin kehuttu, mutta kun totuus paljastui niin hävisi julkisuudesta koko tapaus siellä aika äkkiä. Uusi prosessori arkkitehtuuri on sitten pikkasen vielä vaikeampi ja heti lupaillaan noin älyttömiä... Voi tehdä valistuneen arvauksen mitä on tulossa.
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
19 597
Tästä tulee mieleen kun Kiinassa julkaistiin parisen vuotta sitten ensimmäinen täysin kiinalaisten omin voimin tehty selain korvaamaan länsimaiset. Selaimen "kehittänyt" firma oli saanut ihan valtioltakin tukea. Alkuun oli kovin kehuttu, mutta kun totuus paljastui niin hävisi julkisuudesta koko tapaus siellä aika äkkiä. Uusi prosessori arkkitehtuuri on sitten pikkasen vielä vaikeampi ja heti lupaillaan noin älyttömiä... Voi tehdä valistuneen arvauksen mitä on tulossa.
Ei tämä Tachyum ihan tyhjästä yhtäkkiä ole ilmestynyt, vaan kuten tähänkin ketjuun on jo linkattu esitellyt arkkitehtuuriaan tarkemmin jo HotChips 2018 -tapahtumassa
 
Liittynyt
23.08.2017
Viestejä
221
Ei tämä Tachyum ihan tyhjästä yhtäkkiä ole ilmestynyt, vaan kuten tähänkin ketjuun on jo linkattu esitellyt arkkitehtuuriaan tarkemmin jo HotChips 2018 -tapahtumassa
Huomasin kyllä, että "Rado" perustanut tuon 2016 ja omaa aika paljon alalta kokemusta ei siinä mitään. Kuulostaa vaan aika nopeaan saaduilla saavutuksilta.... "Nopeampi kuin Xeon pienempi kuin ARM"
 
Liittynyt
16.10.2016
Viestejä
10 179
Tachyonin mukaan :
Outperforms Xeon on SpecInt & SpecFP 2006 benchmarks
• One 3.5GHz Xeon E5-2687W v4 core vs one Prodigy core, same GCC 7.2


Vähän kyllä kuulostaa liian hyvältä ollakseen totta tämä Tachyum.
Ota nyt huomioon, että kyseessä on newähööd firman markkinointiosaston hehkutustulokset. Tällöin tuo "kuulostaa liian hyvältä ollakseen totta" myös yleensä pitää paikkansa. Jos noilla olisi oikeasti tuollainen tuote, niin se kannattaisi laittaa testiin muutamalle isolle kolmannelle osapuolelle. Riippumattomia testaajia löytyy kyllä. Jos ne toteaisivat saman, niin silloin voisi jytkyttää oikeasti menemään.
 
Liittynyt
27.12.2016
Viestejä
1 713
Jäin miettimään sitä miten ihmeessä rautaemulointi onnistuu heterogeenisellä ISAlla. Vastaus löytyi kun lueskeli vähän syvemmälle matskuihin eli kaikki järjestelmäsofta on natiivia ja tuki sovelluksille toteutetaan ohjelmistopohjaisella emulaatiolla ala Rosettas Stone.
Mielenkiintoista on rakenteessa se että liukuhihnoista muistiohjaimille kaikki on samoilla kelloilla ja puskurointia ei ilmeisesti ole tai sitä on todella vähän. Toiminnan vakauden takaamiseen käytetään yliresursointia sekä todella järeää virheen korjausta.
Jotenkin tuntuu että pääsen hkultalan kanssa vielä vääntämään siitä onko lähestymistavassa järkeä
 
Liittynyt
21.06.2017
Viestejä
6 258
Jotenkin tuntui että tuossa videolla unzip ja zip asennus kesti pienen ikuisuuden. Asennukseen varmaan käytettiin ihan natiiveja binäärejä. Eli ei ton teho nyt ainakaan oikein vakuuttanut tuossa.
 
Liittynyt
22.10.2016
Viestejä
9 832
Tachyonin mukaan :
Outperforms Xeon on SpecInt & SpecFP 2006 benchmarks
• One 3.5GHz Xeon E5-2687W v4 core vs one Prodigy core, same GCC 7.2


Vähän kyllä kuulostaa liian hyvältä ollakseen totta tämä Tachyum.
Verrattu 4 vuotta vanhaan Xeoniin (joka ei tue avx-512sta), ja tuo voisi tulla markkinoille aikaisintaan joskus loppuvuodesta 2021. Eli käytännössä yli 5 vuoden ero.

Noiden piiristä ei ole vielä ilmeisesti yhtään oikeita fyysisiä prototyyppejä olemassa, eli ne on vaan ilmeisesti ajaneet sitä fpgalla todella pienellä kellolla, ja sitten vaan kertoneet tuloksen sillä kuinka moninkertaisille kelloille arvioivat lopullisen piirin kellottuvan. Ja kivasti vääristyy tulokset esim muistiviiveiden osalta.

Toinen mikä vaikuttaa muistiviiveisiin on se, että sillä FPGAlla ytimiä on ehkä 1-4 kpl mikä auttaa selvästi saamaan niitä muistiviiveitä (kellojaksoissa, ei absoluuttisessa ajassa mitattuna) muutenkin alas
 
Viimeksi muokattu:
Liittynyt
22.10.2016
Viestejä
9 832
Jotenkin tuntui että tuossa videolla unzip ja zip asennus kesti pienen ikuisuuden. Asennukseen varmaan käytettiin ihan natiiveja binäärejä. Eli ei ton teho nyt ainakaan oikein vakuuttanut tuossa.
Todennäköisesti videolla nähtiin n. 400 MHz:lla pyörivä FPGA. johon juuri mahtuu 1-4 noiden ydintä.

Ja benchmark-tulokset on sitten vaan kerrottu 10llä että saatu "arvioitu 4 GHz tulos".
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
19 597

Nyt sanovat että "Post-layout verilog simulaation" mukaan olisi nopeampi kuin NVIDIAn ja Intelin piirit
SANTA CLARA, Calif., August 11, 2020 – Tachyum™ Inc. today announced that it has successfully completed a demonstration showing its Prodigy Universal Processor running faster than any other processor, HPC or AI chips, including ones from NVIDIA and Intel. This is the latest of many recent milestones achieved by Tachyum as the company continues its march towards Prodigy’s product release next year.


Tachyum demonstrated how its computational operation and the speed of its product design, using an industry-standard Verilog simulation of the actual Prodigy post layout hardware, is the superior solution to current competitive offerings. Not only does Prodigy execute instructions at very high speeds, but Tachyum now has an infrastructure implemented for automatically checking correct results from the Verilog RTL. These automated tests check Verilog output for correctness compared to Tachyum’s C-model, which was used to measure performance, and is now the ‘Golden Model’ for the Verilog hardware simulation to ensure it produces identical, step-by-step results.


This verification milestone dramatically increases Tachyum’s productivity and its ability to test the Prodigy hardware design efficiently in order to find bugs and correct them prior to tape-out. With this latest accomplishment, Tachyum now has automated the constrained random test generation capability, which further adds to its productivity.
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
19 597
Linux boottaa, kykenee suorittamaan ainakin jotain sovelluksia ja sammuu hallitusti FPGA-versiolla Prodigystä

 
Liittynyt
27.12.2016
Viestejä
1 713
"The company is building the world’s fastest 64 AI exaflops supercomputer in 2022 in the EU" jahas, onko kenelläkään mitään havaintoa moisesta projektista? Ei ole itselleni tullut verkostoissa vastaan tällaista.
 
Liittynyt
18.10.2016
Viestejä
30
"The company is building the world’s fastest 64 AI exaflops supercomputer in 2022 in the EU" jahas, onko kenelläkään mitään havaintoa moisesta projektista? Ei ole itselleni tullut verkostoissa vastaan tällaista.
Ilmeisesti Slovakiaan tuollainen olisi tarkoitus rakentaa ..
 
Toggle Sidebar

Statistiikka

Viestiketjut
193 910
Viestejä
3 504 613
Jäsenet
62 415
Uusin jäsen
Simpp@

Hinta.fi

Ylös Bottom