반응형
시피유의 L1,ㅣ2 캐시가 뭐죠?? 어떻게 쓰이죠?? 그게 많으면 성능이 좋다는 것도 알겟는데...
그리구, 486 같은거에서부터 지금의 인텔이나 AMD CPU 에 쓰인 기술도 설명 해주심...
MMX 나 3D NOW 같은거요... 상세히...


L1과 L2, L3는 컴퓨터 내의 캐시 메모리의 계층들이다. 만약에 컴퓨터 프로세서가 다음 번 연산을 위해 필요한 데이터를 캐시 메모리 내에서 찾을 수 있다면, 그것을 램으로부터 가져오는 것과 비교할 때 많은 시간을 절약할 수 있게 된다. L1이란 "level-1"의 약자로서, 마이크로프로세서 칩 그 자체 내에 마련되어 있는 캐시메모리이다. 예를 들어, 인텔 MMX 마이크로프로세서의 경우에 32 KB의 L1 캐시메모리가 딸려 내온다.

"level-2"의 약자인 L2 캐시메모리는 메인 메모리에 비해 더욱 빠르게 액세스할 수 있도록, 별도의 칩이나 확장 카드 상에 구현되어 있다. L2 캐시메모리는 1 MB 정도의 크기가 가장 보편적이다.

그렇다면 L1,L2,L3 캐시 메모리의 차이와 역할은 무엇일까?

1. L1 캐쉬

먼저 L1캐쉬부터 설명을 하자면 L1 캐쉬는 CPU 내부에 존재하며 가까운 순서 대로이니 L1캐쉬가 가장 CPU에 근접한 메모리라고 생각하면 된다. 일단 데이터를 L1 캐쉬에 쓴 다음 연산 유니트에서 이를 처리하는 것이다.


2. CPU와 주변기기들 간의 병목현상(L2캐쉬)

CPU의 클럭 발전이 고속화되면서 주변기기들이 그 CPU에 상응하지 못함에 따라 병목현상이라는 것이 생겼다. 만약 CPU 클럭이 66MHz 라고 가정하고 메인보드의 클럭이 66MHz라면 그 차이만큼 CPU는 헛놀게 되고 비효율적이라는 이야기다. 이러한 병목의 처리를 주된 과제로 기업들이 고안해 낸 것이 Level 2 캐쉬로 이는 PC 뿐만 아니라 매킨토시에도 존재한다. 주 메모리보다 빠른 메모리를 채용함으로서 클래식 팬티엄, MMX 팬티엄은 병목문제를 완화해보려 했다. 그런데 문제는 그것 가지고는 L2 캐쉬 또한 66MHz가 되는 것이니 큰 이득을 보지 못한다.

3. L3 캐쉬

L3 캐쉬의 탄생연유는 여러 가지가 있는데 그 중 가장 대표적인 것이 L2 캐쉬를 CPU에 내장함으로써 메인보드의 캐쉬가 놀게 된다는 것을 이용한 K6+3d의 L3캐쉬가 대표적인 예다. AMD 사의 경우 하이엔드 솔루션에 일부러 대용량의 L3캐쉬를 메인보드에 탑재해 성능을 올린
다고 밝혔다. 그러니까 L3캐쉬는 우연히 생겨난 것인 셈이다.


4. CPU의 성능과 L1, L2, L3 캐쉬

그리고 확실한 CPU의 성능향상을 위해선 L1 캐쉬 량을 늘리는 것이 최고의 대안이다. 다만 이상하게도 L2캐쉬를 CPU에 집적하는 것보다 L1캐쉬를 집적하는 것이 돈이 더 많이 든다는 것이다.



ㅇMMX
: MMX 기술은 MMX가 아닌 이전의 마이크로프로세서에 비해, 다음 세 가지 주요한 개선이 이루어졌다.
1. 비디오, 오디오 그리고 그래픽 데이터를 좀더 효율적으로 처리하기 위해 57개의 새로운 마이크로프로세서 명령어들이 추가되었다.
2. SIMD라고 불리는 새로운 프로세스가, 하나의 명령어로 여러 개의 데이터 항목들에 대해 동일한 연산을 수행할 수 있도록 해준다.
3. 마이크로프로세서 상의 캐시메모리가 32 KB로 증가되었으며, 이는 마이크로프로세서의 외부에 있는 주기억장치의 참조 횟수를 줄임으로써 속도를 빠르게 할 수 있음을 의미한다.

ㅇSSE
: SSE는 SIMD 연산을 수행하는 70개의 명령어 셋으로 구성되어 있으며. 그밖에도, 펜티엄 III에는 이러한 명령어들을 지원하기 위해 여기에만 전념하는 8개의 128 비트 길이의 레지스터들이 딸려 나온 답니다. SSE를 사용하기 위해서는 프로그램에서 SSE를 지원해주어야만 하며 최근에는 많은 프로그램과 게임에서 SSE를 지원해 주고 있습니다...

ㅇ SSE2(Streaming SIMD Extensions 2)
: Pentium 4에서 사용되는 SSE2 명령어는 인텔에서 제안한 명령어 코드로 인텔에서 제조하는 프로세서에서 기본 지원되는 명령어입니다. 최적화된 소프트웨어와 함께 사용할 경우 50-80% 가량의 성능 향상을 가져오는 명령어입니다.

ㅇ3DNow!
: 3DNow!는 MMX나 스티리밍 SIMD 와 같은 개념의 멀티미디어 확장 명령군입니다. MMX가 멀티미디어 데이터를 고속으로 처리하기 위해 58개의 별도 명령어를 통해 이미지,사운드 등의 데이터를 전문으로 연산하는 것과 같이 3DNow!도 21개의 명령어를 사용하여 멀티미디어 데이터를 처리합니다. 다른 점이 있다면 부동소수점 연산이 가능하다는 것입니다. MMX는 실수 연산만 가능하여 이미지나 사운드,MPEG 디코딩에는 효과가 있지만 3D 그래픽이나 VRML등에서는 성능을 발휘하지 못한다는 것입니다. 반면 3DNow!는 부동소수점 연산을 통해 고속의 3D 그래픽이 가능하다. 또한 MMX-to-부동 소수점이라는 기능으로 MMX와 데이터 전환이 자유롭습니다.
데이터의 처리 과정을 보면 3DNow!를 지원하는 게임에서 주인공의 움직임을 그리는 명령이 내려지면 명령어와 데이터가 각각 명령에 캐시와 데이터 캐시에 전송됩니다. 3DNow! 명령은 명령어 디코더에서 CPU가 이해하는 코드로 바꿔주고, 주어진 명령이 3DNow! 명령인지 정수 명령인지, 부동소수점 명령인지 명령어 컨트롤 유닛에서 판별합니다. 3DNow!명령으로 확인되면 연산 엔진에서 3DNow! 유닛에 보내 연산을 마칩니다.


① INTEL 계열 ≫4004

인텔 최초의 마이크로프로세서로써 108KHz, 4Bit, 10미크론 공정으로 비지콤(Busicom) 계산기에 사용되었다.

≫8008
4004보다 성능이 2배로 향상된 제품으로, 200KHz, 8Bit, 10미크론 공정으로 덤 터미널로 사용되었다.

≫8080
최초의 퍼스널 컴퓨터로써 8008보다 10배 증가한 성능, 2MHz , 8Bit 로 동작.

≫8086
IBM이 선보인 최초의 PC에 채택된 마이크로프로세서이다. 8080보다 10배 증가한 성능을 냈다. 5, 8, 10Mhz 16Bit

≫286
80286으로도 알려진 286은 이전에 개발된 마이크로프로세서 기반으로 사용된 모든 소프트웨어와 호환이 가능한 인텔 최초의 프로세서이다. 발표 6년 후 전세계에 약 1,500만대의 286 기반 PC가 보급되었다. 8086의 3~6배의 성능.

≫386
최초의 마이크로프로세서인 4004의 트랜지스터 수보다 100배 증가한 27만5,000개의 트랜지스터로 구성되어 있다. 32비트 칩으로서, 한번에 여러 개의 프로그램을 운용할 수 있는 멀티태스킹 기능을 가지고 있다.
32비트 데이터를 처리할 수 있는 최초 -86 제품. 25,33MHz 가 있습니다.

≫486SX
118만 5천개의 트랜지스터로 16, 20, 25, 33MHz 의 속도가 있습니다.

≫486DX
CPU 의 외부 크럭과 그 배수로 내부크럭을 조합하기 시작하였으며 초기의 25, 33, 50, 66MHz 제품과 후반부엔 100, 120MHz 의 제품까지 나왔습니다.

≫Pentium P5
Pentium P5 는 초기 60, 66 제품을 말합니다. CPU 크기가 크며 CPU I/O 코어 5V를 사용하여 발열양이 엄청났으며 60, 66MHz 이 있습니다. 허나 CPU 불량으로 인해 그 수명이 오래가지 못한 불운의 CPU 중 하나입니다.

≫Pentium P54C
Pentium은 ,X86계CPU이고 ,인텔 프로세서로는 처음 L1 캐쉬를 분리했다.명령 8KB,데이터 8KB,로 합계 16KB CPU소켓은 ,Socket7 CPU I/O 코어 친구,3.3V으로 동작하시는 MMX 명령이 들어있지 않습니다. ( 75, 90,100, 120, 133, 150, 166, 200MHz)

≫Pentium MMX P55C
57 개의 MMX 명령을 내장하여,멀티 미디어의 처리에 좋습니다.L1 캐쉬 명령 16KB,데이터 16KB,로 합계 32KB으로 분기 예측이나 파이프라인의 메커니즘 등의 개량에 의해 MMX 명령 이외에서도 P54C보다 10―20%정도 퍼포먼스가 높다. CPU소켓은 ,Socket7 CPU I/O 3.3V 코어 2.8V으로 동작합니다.( 166,
200, 233MHz)

≫Pentium PRO
Pentium Pro는 X86계의 제6 세대의 CPU으로 X86 명령을RICH용 명령에 동작하고 실행한다.L1 캐쉬 명령 8KB,데이터 8KB,로 합계 16KB을 내장하고 그 밖에 256KB 또는 512KB의 전용의 대 용량 L2 캐쉬를 가지고 CPU 동작 클럭과 동일 클럭으로 작동하여 대단히 높은 퍼포먼스를 얻고 있다.그러나,32 비트 명령 실행 속도는 빠르지만 16 비트 명령 실행 속도가 약간 낮은 결점 때문에 686급임에도 P5 와 같이 단명한 제품임. MMX 지원 없음. (166, 180, 200MHz)

≫Pentium II
코드명 클라매쓰로 불리던 제품이 333MHz까지의 66MHz의 외부클럭을 사용하는 제품. 데슈츠는 FSB가 100MHz인 제품으로 역시 PENTIUM2가 정식 명칭이며,66MHz인 클라매쓰와 구분하기 위해 코드명을 부르기도 합. 클라매쓰의 경우에는 0.35미크론 데슈츠의 경우에는 0.25미크론임. PENTIUM2는 PENTIUM Pro에 MMX기능을 추가하고 클럭스피드를 올린것으로 보면 된다.펜티엄2는 펜티엄급에서 메인보드에 박혀 있던 2차캐시(L2)를 CPU패키지 안에 넣었으며, L2캐시는 CPU의 2분의 1속도로 동작하게 된당. 따라서 펜티엄2 메인보드에는 L2캐시가 필요 없게 되었습니다. 또한 펜티엄2는 메인메모리를 64GB 까지 사용할 수 있으나 캐시는 512MB까 지만 가능하도록 제한했구 현재 출시된 제품은 클라매쓰와 데슈츠급으로 각각 66MHz와 100Mhz의 FSB(Front Side Bus 혹은 외부클럭)를 지원하며, 클라매쓰 계열은 233부터 최고 333까지 출시되었구, 데슈츠는 350MHz과 400MHz급 그리고 최고 클럭으로 450MHz이렇게 세가지의 제품이 있습니다

≫Celeron, Celeron A
코빙턴의 경우에는 L2캐시가 완전히 없어진 것이고 멘도시노는
CELERON A라고 불리우는데 128K캐시를 장착한 제품 입니다. 멘도시노는 가격은 같은 클럭스피드의 PENTIUM2와 비교하여 2배정도의 차이가 나지만 성능은 거의 동등함니다. 캐시가 4배나 차이가 나는데 성능이 비슷한 이유는 PENTIUM2의 경우 L2캐시가 CPU의 절반 속도로 밖에 작동하지 못했으나 CELERON은 L2캐시가 CPU의 동일한 속도로 작동하기 때문에 적은 L2캐시로도 비슷한 성능을 낼수 있습니다.. CELERON은 코빙턴과 멘도시노 둘다 66MHz의 FSB(Front Side Bus 혹은 외부클럭)을 지원하며 코빙턴은 233, 266, 300, 333MHz 멘도시노는 300, 333, 366, 400, 433, 466, 500, 533MHz의 클럭스피드를 가진 제품이 있습니다. 초기의 슬롯 1에서 요즘은 방식인 소켓 370 제품으로만 출시 됨니다.

≫XEON
PENTIUM II 로써 FSP 100MHz 와 L2 케쉬가 2~4M 인 서버용 CPU 슬롯 1 이 아닌 슬롯 2를 체택한 제품 크기또한 팬티엄 II 의 두배정도로 정사각형에 가깝습니다.

≫Pentium III 코드명 : KATMAI99년 전반기에 나온 CPU로서 450, 500, 550MHz의 클럭스피드로 제조공정은 0.25미크론, 카트마이는 지금까지 INTEL이 밝힌 바대로 부동소숫점 연산에서 'SIMD' (Single Instruction Multiple Data) 라는 기술을 채택했다. SIMD는 하나의 명령으로 복수의 패키지화 된 데이터를 동시에 병렬 처리할 수 있는 기술임다. KNI (Katmai New Instructions = 카트마이와 태너 이후의 CPU에 포함될 새로운 명령어 채계) 는 8개의 128비트 레지스터가 새로 추가되어 32비트의 부동소수점 데이터를 4개로 묶어 처리할 수 있게 되었다.
또한 INTEL은 메모리 레지스터를 감춘 'Memory Streaming
Architecture'나 기존 MMX 명령의 확장도 발표했다. 이러한 신개념에 의해 카트마이 이후의 CPU에서는 대폭적인 3D그래픽 성능의 향상이 이루어지고, MPEG-2 디코딩만이 아니라 MPEG-2 인코딩이나 자연 음성인식등의 애플리케이션도 충분히 수행할수있게 된 것이다.

≫Pentium III 500E
코퍼마인 계열 CPU. 370소켓 형식을 쓰며 풀스피드 L2캐쉬를 이용 합니다. FSB 는 100MHz 와 133MHz 가 있는데 전압이 1.6V라 BX보드에선 전용 라이져 카드를 이용해야 하며 i820,i810e칩셋을 이용하는 보드에서 사용가능 합니다. 제조 공정은 0.18 마이크론입니다.

≫Pentium 4 코드명 : 윌러메트(Willamette)
펜티엄4는 인텔의 기존의 x86아키텍쳐를 버리고 새롭게 설계한 완전32비트 프로세서이다. 2차캐시 크기는 기존 펜티엄3와 같은 256KB이지만 FSB가 400Mh 로 기존 펜티엄3의 3~4배에 달한다. 펜티엄3의 SSE기능을 개량한 SSE2지원, 하이퍼 파이프 라인 기술, 실행추적캐시, 동적 실행엔진등 인텔의 많은 기술이 총 동원 되었다. 0.18미크론 공정으로 제조되며 4천2백만개의 트랜지스터가 집적되어있다. 처음 발표된 클락은 1.4Ghz.1.5Ghz로 클락도 많이 높아 졌다.

펜티엄4에 적용된 신기술(NetBurst)과 제품 스펙

▶하이퍼 파이프 라인 기술
기존 펜티엄인 경우 5단계의 파이프라인 기술이 적용되었고 펜티엄3 같은 경우는 10단계의 파이프라인 사용한다. 이번 발표된 펜티엄4는 펜티엄3의 2배인 20단계의 파이프 라인을 사용하기 때문에 분기 예측이 높아지는등 더욱 빠른 데이타 처리가 가능하게 된다.

▶Execution Trace Cache and the Dynamic Execution Engine
파이프라인이 길어 지면서 분기 예측 비율은 높아 지지만 만약 실패하게 되면 파이프 라인 20단계를 다시시작 해야 하는 문제점이 생긴다. 이런 오버헤드를 극복하기 위해서 인텔은 Execution Trace Cache and the Dynamic Execution Engine라는 기술을 도입하게 되는 것이다. 

▶400Mhz시스템 버스 사용
펜티엄3 같은 경우 FSB가 100,133Mhz로 경쟁 제품인 AMD의 애슬론의 200Mhz보다 대역폭이 낮기 때문에 성능에 제약을 받았었다. 더욱이 최근의 애슬론 같은 경우는 266DDR램을 지원하게 되어 더욱 대역폭이 차이 나게 된다. 하지만 이번에 발표한 펜티엄4에는 400Mhz의 FSB가 적용되어 훨씬 빠른 시스템 환경을 만들게 된다.

▶SSE2(Streaming SIMD Extension 2)
인텔이 96년 처음 MMX라는 명령어 코드를 발표한 이후에 꾸준히 발전 시켜 SSE로 발전 시켰고 그 결과 SSE는 펜티엄3에 적용되었었다. 이번에SSE2도 펜티엄3에 사용된 SSE의 명령어를 개선하여 만든것으로써 144개의 명령어로 이루어 워 있다. 처음 펜티엄3가 나왔을 때도 SSE 기술에 최적화된 소프트웨어의 부족으로 최적에 성능을 얻지 못한 전례로 보아 펜티엄4도 비슷한 결과를 얻을 것으로 보인다. 따라서 펜티엄4의 실질적인 성능은 아무래도 조금은 더 시간을 갖고 두고 봐야 할 것 이다.


② 비 INTEL계열

≫AMD-K6
AMD-K6는 1 개의 X86 명령을 1―4 개 RISC풍 명령에 이상 (예: 7개의 병렬 실행으로 처리하는 고도의 아키텍처를 씁니다.) L1 캐쉬 명령 32KB,데이터 32KB,로 합계 64KB과 대 용량 특히 32 비트 명령 처리, MMX 지원. Socket7CPU I/O 3.3V 코어 2.9/3.2V으로 동작했지만 266MHz 이상부터는 2.2V 로 동작한다.

≫AMD-K6 3D NOW
K6 3D NOW는 AMD의 독자적인 슈퍼스컬러 MMX 테크놀러지를 응용해 마이크로 소프트의 지원을 통해 다이렉트X에 맞물리는 명령어 코어(이것은 MMX보다 훨씬 유용하다. 특정 MMX 소프트웨어를 지원하는 것이 아니라 다이렉트 X를 가속 하는 것이므로 애플리케이션 운용시 더욱 빠른 속도를 가질 수 있다.
다이렉트 X가 사실상 MMX 소프트웨어보다 대응면이 더 많으므로 범용성에 있어서 득을 취했다고 할 수 있다.)를 탑재하고 그 외에도 3D 함수를 가속하는 코어 를 탑재해 굳이 FPU를 올리지 않고도 최적화된 명령어를 통해 속도 향상을 꾀한 것이다.특히 AMD가 제창한 독자적인 MMX 기술은 차기 제품을 통해 지속적으로 성능 향상을 가져올 것이다.

≫AMD-K6-3
코드네임 AMD K6-3 processor는 K6-2 400과 같은 core를 가지며 CPU clock speed와 같은 속도로 작동되는 256KB의 L2 cache를 장착한다. AMD K6-3는 400Mhz의 속도로 작동함에도 불구하고 펜티엄2 450과 동등한 속도를 보이게 만들어질것이라고 한다. [M/B가 K6-2 400MHz를 지원한다면(BIOS가 지원해서) K6-3또한 아무문제없이 작동할수있다고 함] FIC가 이미 K6-3를 지원하는 BIOS를 MVP3 chipset이 달린 메인보드를 위해 업데이트해서 AMD K6-2 400과 AMD K6-3를 지원하기로 했다. 메인보드의 업그레이드 없이 K6-3는 CPU내의 256KB의 L2 캐시외의 캐시메모리(메인보드등의)는 level 3 cache로 사용하며 이는 3-5%정도의 전체적인 시스템 성능향상을 보이게 만든다고 한다.

AMD는 인텔이 갑작스럽게 메인보드 시장을 slot-1으로 옮긴 것 처럼 새로 시장을 형성하지 않고 기존의 슈퍼7의 시장이 지속되도록 하고 있다.

≫AMD-K7 코드명 : 에슬론
AMD K-7은 완전히 새로운 AMD의 프로세서로 K6-2/3에서 지원되는3D Now! 기술을 채용한 것이외에도 기존의 소켓7을 버리고 Slot-A라 불리는 slot 타입의 디자인을 채용했다. 이 slot-A는 기존 인텔의 slot-1과 구조상 pin이 대응은 되지만 완전히 다른 bus 구조를 가진다.

펜티엄2가 P6 bus 라는 architecture를 가진 반면 AMD K7은 alpha EV6라는 bus protocol을 이용한다. 이 alpha EV6 bus protocol은 이론상 인텔의 P6 bus에 비해 앞선 기술이다. K7은 512Kbsp서 1MB의 L2 cache를 CPU cartridge에 포함한 모습이다. 이는 펜티엄II와 매우 유사하지만 카트리지의 케이스를 벗기면 독특한 차이를 발견할 수 있다. K7 chip자체의 크기가(card와 cache를 제외한) 펜티엄II의 데슈츠코어의 크기에비해 절반밖에 안된다는 점이다. K7은 L1 cache를 128KB 탑재하고 있으며 같은 클럭의 펜티엄II보다 차이가 날 정도로 성능이 향상되었다고 한다. K7은 200Mhz 의 EV6 bus하에서 작동하며 AMD 최초로 multiprocessor를 지원할것이 라고 한다.

≫Cyrix6x86(6x86L)
Cyrix6x86은 Pentium과 핀 상호 호환 CPU으로 동등 또는 그이상의 성능을 갖는 L1 캐쉬 16KB으로 명령 데이터를 분리하지 않는 방식을 취해 소비 전력이 많고 발열이 심한 결점을 보충하여 저 전압 타입의 6x86L이 추가된 IBM 브랜드도 같은 것입니다. MMX 명령의 지원 없음

≫Cyrix M2
M2는 MMX 기술의 채용과 함께 동작 주파수도 높혀 설계되었다. M2나 P55C 모두 2명령 동시 실행 수퍼스케일러 구성이지만 수행 효율은 M2쪽이 높다고 한다. 펜티엄 MMX는 MMX 명령용의 레지스터로 이전부터 갖고 있는 부동 소수점 연산 레지스터를 이용한다. 이때문에 부동 소수점 연산 명령과 MMX 연산, 양쪽을 사용할 필요가 있는 프로그램에서는 레지스터의 데이터를 일단 메모리로 옮겨야 한다.

사이릭스사의 M2도 부동 소수점의 레지스터를 이용한 점에서는 인텔과 같지만, 다른 점은 M2가 보다 큰 64KB의 1차 캐시를 갖고 있다는 점이다. M2는 이부분을 일반적인 캐시와 분리해서 레지스터의 데이터를 옮기는데 사용한다. 이것이 캐시 라인록(Cache Line Lock) 기능이며 이때 사용되는 캐시를 스크래치 패드 메모리(Scratch Pad Memory)라고 한다. M2의 1차 캐시를 일반적으로 데이터 캐시라 하지 않고 유니파이드 캐시라 하는 것도 이런 이유에서이다. 1차 캐시는 메인 메모리에 비해 상당히 빠른 속도로 엑세스할 수 있다. 이 때문에 부동 소수점 연산 명령과 MMX 명령의 양쪽을 사용하는 3차원 그래픽 처리 등에서는 캐시라인록 기능이 없는 펜티엄 MMX 보다 특히 고속화를 기대할 수 있다고 한다. 단 M2는 MMX 명령을 동시에 1개밖에 실행할 수 없다. CPU소켓은 ,Socket7 CPU I/O 3.3V 코어 2.8V으로 동작합니다.


펜티엄4 423과 페티엄4 478의 의미

펜티엄4 423과 펜티엄4 478에서 뒤에 붙은 숫자는 CPU에 사용된 핀의 수로, CPU인터페이스라고 생각하면 쉽습니다. 초창기의 펜티엄4 CPU들은 모두 423개의 핀을 가지고 있었지만, 최근에는 478개의 핀수를 가지고 있는 펜티엄4가 출시되어 서로 공존하고 있는 형태입니다.
두 인터페이스의 차이에 따라 같은 펜티엄4라도 CPU의 모양이 서로 다르며 지원할 수 있는 CPU도 다릅니다. 펜티엄4 423인터페이스의 경우 앞으로 출시될 인텔의 최신 CPU인 코드명 노스우드를 사용할 수 없지만, 478인터페이스는 사용할 수 있습니다. 현재 가격에서 423용 펜티엄4와 메인보드가 약간 더 저렴하지만, 앞으로를 생각한다면 펜티엄4 478과 메인보드를 구입하는 것이 더 유리합니다.
펜티엄4 478이 더유리한 이유는 현재 펜티엄4 CPU시장은 크게 펜티엄4 423과 478로 양분되어 있습니다. 서서히 478버전으로 넘어가고 있는 추세인데, 478은 423에 비해 어떠한 장점이 있는지 알아보겠습니다.
우선 478용 펜티엄4는 423에 비해 CPU의 크기가 매우 작은데, 이렇게 CPU가 작으면 열처리 문제나 CPU를 장착하는 데 더 유리합니다. 또한 478은 앞으로 출시될 인텔의 최신 CPU들이 채용할 인터페이스이기 때문에 업그레이드를 위해서라면 423보다 478이 유리한 위치에 있습니다. 이 외에도 478은 별도의 냉각팬 장착 가이드를 제공하기 때문에, 냉각팬 설치가 매우 편리해졌다는 장점도 있습니다.



펜티엄4는 템티엄 III 보다 얼마나 뛰어날까?

진정한 7세대 CPU인 펜티엄4는 그동안 사용되어 오던 6세대 CPU의 한계를 극복하기 위해 완전히 새로운 기술로 제작되었습니다. 인텔에서는 펜티엄4에 사용된 신기술을 넷버스트(Net Burst)라 부르고 있습니다.

7세대 CPU인 펜티엄4를 사용하려면 여러 가지 요구 조건이 있는데, 우선 경우에 따라서 기존에 사용하던 메인보드, 메모리, 케이스, 전원공급장치는 사용할 수 없다는 것을 알아두어야 합니다. 메인보드의 경우 i850칩셋을 사용한 제품이라면 SDRAM이 아닌 램버스 DRAM을 2개씩 장착해야 합니다. 또한 펜티엄4의 거대한 방열판과 높은 전원 소비량을 감당하기 위해서는 케이스와 전원 공급기도 가급적 교체하는 것이 좋습니다. 결국 펜티엄4를 사용하기 위해서는 기존부품을 대부분 교체해야만 한다는 것입니다. 과연 그만큼의 성능이 나올 수 있는지 테스트한 결과를 통해 간단히 살펴보겠습니다.


벤치마크 테스트 환경

구분
펜티엄4 1.5GHz PC
펜티엄4 1.5GHz PC

CPU
펜티엄III 1GHz
펜티엄4 1.5GHz

메모리
256MB PC-133
256MB RAMBUS DRAM

메인보드
인텔 i815
인텔 i850

그래픽카드
GeForce2 MX200 32M
GeForce2 MX200 32M


윈벤치 99 CPU 테스트

구분
펜티엄III 1GHz
펜티엄4 1.5GHz

CPU
89.1
측정 불가

FPU
5,980
5,490


단위가 없는 절대값으로, 값이 클수록 우수합니다.

산드라 2000 CPU 테스트

구분
펜티엄III 1GHz
펜티엄4 1.5GHz

FPU
1,054
875

CPU
2,687
3,043


FPU단위는 MFLOPS, CPU단위는 MIPS로, CPU가 처리하는 속도를 의미합니다. 값이 클수록 우수합니다.

CPU를 테스트하는 가장 보편적인 벤치마크 프로그램인 윈벤치 99와 산드라2000을 사용해 성능을 알아보았습니다. 그런데 주목할 만한 결과가 나왔습니다. 일반적인 CPU테스트에서는 펜티엄4가 펜티엄III에 비해 그리높은 성능을 보이지 않았지만, 메모리 성능 테스트에서는 펜티엄4가 압도적으로 우수한 결과를 보였습니다. 이것은 펜티엄4가 CPU성능에서는 기존 CPU에 비해 완벽하게 최적화되어 있지 않지만, 400MHz의 FSB와 800MHz의 듀얼 램버스 메모리는 기존의 펜티엄III에 비해 비약적인 발전을 이루었다는 것을 의미합니다.

대부분의 항목에서 펜티엄4가 우수한 성능을 나타냈는데, 이것은 높은 클록속도와 메모리 대역폭 때문으로 보입니다. 결국 펜티엄4는 기존의 펜티엄III를 대체할 차세대 CPU로서 손색이 없을 것입니다.

FPU(Floating Point Unit)

부동소수점 처리 장치, 혹은 수치연산 보조 프로세서로 알려져 있는 FPU는, 컴퓨터가 사용하는 기본 마이크로프로세서보다 더 빠르게 어려운 계산을 수행할 수 있는 특별한 회로 설계 또는 마이크로프로세서를 말한다. FPU는 전적으로 대형 수학적 연산에만 초점을 맞춘 특별한 명령어 세트를 가지고 있기 때문에 빠른 연산을 수행할 수 있다.

ECC란 무엇인가?

ECC는 'Error Correction Code'의 약자로, 오류 정정 코드를 의미합니다. 데이터의 양이 늘어남에 따라 메모리와 CPU(Central Prosess Unit)사이의 데이터 전송시 데이터 유실로 인한 오류 발생이 빈번해졌습니다. 따라서 이를 찾아내고 수정하는 데 ECC기능이 사용되는 것입니다.
ECC기능은 CPU에 추가되는 것이아니라 메인보드에 사용되는 칩셋에 추가되므로, 펜티엄III든 그 이전 CPU든 상관이 없습니다. 칩셋에 ECC기능이 없던 386 이전 메인보드에서는 RAM자체에, 오류 정정 RAM(패리티 체크 RAM)이 이러한 오류를 해결했습니다.

패리티(Parity)

데이터가 저장장치 내의 한 장소에서 다른 장소로 이동되거나, 컴퓨터간에 전송될 때 데이터가 유실 또는 손상되었는지 여부를 점검하기 위해 데이터에 부가하는 여분의 정보이다. 데이터에 포함되는 1개의 데이터가 항상 짝수 혹은 홀 수가 되도록 하기 위해 원래의 데이터 끝에 부가하는 여분의 비트이다.



클록과 CPU의 속도는 어떤 관계가 있는가?

'66MHz'는 컴퓨터의 속도를 말하지만, CPU가 낼 수 있는 최대 속도를 지칭하는 것은 아닙니다. 66MHz의 속도라면 1초에 66X1,000,000번만큼 진동하는 신호로 작동하는 상태입니다. 66MHz의 속도 신호를 CPU가 받아 그 속도대로 작동을 하는 것입니다.
여기서 말하는 속도 신호 크기가 클록의 크기입니다. 메인보드 내에 있는 오실레이터(수정발진회로)라는 장치에 의하여 25MHz혹은 33MHz의 클록이 발생하고, 이 클록에 의하여 CPU 및 다른 주변기기도 그 속도대로 동작합니다. CPU속도는 스스로 결정하는 것이 아니라, 오실레이터에서 발생해 CPU에 공급되는 클록 신호의 크기가 결정합니다.



FSB 속도가 높을수록 시스템 성능은 크게 향상된다

FSB(Front Side Bus)는 CPU가 외부적으로 동작하는 클록을 말합니다. 여기서 내부 및 외부라는 것은 신호가 CPU밖을 떠날 때와 그렇지 않을 때를 기준으로 구분합니다. CPU는 무척 고속으로 동작하는 장치이기 때문에 하드디스크, 전송 버스는 물론, 심지어 빠르다는 메모리도 따라가지 못합니다. 그러므로 CPU밖에서는 신호를 일정 주기로 낮춰야 합니다. 이때 CPU밖에서 동작하는 클록을 FSB라고 합니다. 예를 들어 펜티엄III 900MHz라면, CPU 내부에서는 데이터가 초당 900MHz로 움직이다가 CPU밖으로 나오면 100MHz로 떨어집니다.

FSB가 높으면 주변장치의 성능이 높아지므로 속도가 빨라집니다. 여기서 주변장치란 주로 메모리를 가리키는 것입니다. 메모리에 비하면 하드디스크는 너무느려 상대도 되지 않습니다. 즉, FSB가 높아지면 CPU와 메모리 사이의 데이터 전송 속도가 빨라지므로 시간당 연산 능력이 높아집니다. 따라서 당연히 PC 성능이 좋아집니다. 물론 이때 메인보드 칩셋과 메모리가 FSB를 지원해야 합니다.







Athlon MP(애슬론 MP)
AMD 애슬론 MP 프로세서 개요

QuantiSpeed™ 아키텍처와 Smart MP 기술을 채용한AMD 애슬론 MP™ 프로세서는 탁월한 멀티프로세싱 성능을 자랑하는 최신 AMD 애슬론 프로세서 계열 제품입니다. AMD 애슬론 MP 프로세서는 AMD Smart MP 기술을 바탕으로 보다 효과적인 멀티프로세싱을 지원하기 위해 완벽한 기능을 갖춘 로직을 구현했습니다. QuantiSpeed 아키텍처를 채용한 AMD 애슬론 MP 프로세서는 클럭 사이클 당 동시에 처리할 수 있는 작업의 양을 증가시키고 프로세서의 운영 주파수를 향상시킴으로써 탁월한 성능을 발휘, 애플리케이션 실행 성능이 놀랍도록 향상됩니다. AMD 애슬론 MP프로세서는 세계 최초의 고성능 멀티프로세싱 서버 및 워크스테이션용 7세대 x86 프로세서입니다. 한 개 또는 두 개의 프로세서가 장착된 서버 및 워크스테이션 플랫폼을 지원하며 특히 기업 및 엔터프라이즈 시장의 사용자들을 겨냥한 기본 구성 요소를 제공합니다.

본 프로세서는 다중으로 일을 처리하거나 촉박한 업무의 애플리케이션 실행을 최적화하고, 첨단 소프트웨어 애플리케이션의 안정성 및 연산 집약적인 요구에 부응하도록 설계되었습니다. 이것은 오늘날 대부분이 요구하는 Microsoft? Windows? 호환 업무용 및 멀티미디어 애플리케이션을 실행하기 위한 서버 및 워크스테이션을 구축할 수 있으며, 향후 소프트웨어 및 운영 체제의 업그레이드에 대비할 수 있는 충분한 성능을 보유하고 있습니다.

보다 빠른 애플리케이션 실행을 위해 QuantiSpeed 아키택처 채용

QuantiSpeed 아키텍처는 업계 저명한 상을 수상한 바 있는 AMD 애슬론 프로세서 코어를 개선한 최신 기술 발전의 개가로서 서버 및 워크스테이션 애플리케이션 상에서 보다 뛰어난 성능을 발휘합니다. QuantiSpeed 아키텍처의 핵심은 9 이슈, 슈퍼스칼라, 완전 파이프라인형 코어입니다. 이는 애플리케이션 명령을 코어의 실행 엔진으로 전송하는데 보다 많은 경로를 제공함으로써 프로세서가 일정한 클럭 사이클 동안 훨씬 많은 작업을 수행할 수 있도록 지원하게 됩니다. QuantiSpeed 아키텍처의 새로운 기능으로는 슈퍼스칼라, 완전 파이프라인형 부동 소수점 엔진, 하드웨어 데이터 프리페치(prefetch), 그리고 배타적(exclusive) 및 추론적(speculative) TLB (Translation Look-aside buffers) 등이 있습니다. 이러한 기능의 결합을 통해 개발자들은 보다 효율적으로 시각화, 설계 및 애니메이션 작업 등을 수행할 수 있으며, 서버의 처리 성능 및 트랜잭션 기능이 향상되고 전반적인 생산성이 향상됨으로써 IT 관리자들의 요구도 거뜬히 처리할 수 있습니다.

Smart MP 기술을 이용한 보다 효과적인 멀티 프로세싱

멀티프로세싱 플랫폼의 가장 큰 이점은 Smart MP 기술로, Smart MP 기술은 프로세서와 칩셋이 보다 효율적인 플랫폼을 제공하고 전반적인 성능이 향상되도록 해줍니다. 2개의 독립적인 포인트-투-포인트 버스와 우수한 캐시 관리 시스템이 프로세서 간의 고속 통신을 지원하는 버스와 함께 통합되어 이 새로운 플랫폼이 IT 관리자들을 위한 효율적이고 비용 효율적인 탁월한 솔루션으로 자리잡게 되었습니다.

Smart MP 기술의 또 다른 특징으로는 데이터 및 메모리 트래픽을 관리하는 최적화된 캐시 코히런시(coherancy) 프로토콜뿐만이 아니라, 멀티프로세싱 시스템에서 CPU간의 고속 통신을 실행할 수 있도록 지원하는 혁신적인 "스눕(snoop)" 버스가 있습니다. 또한 트랜잭션 기반의 버스 프로토콜을
이용할 경우, 처리되지 않은 데이터 요청을 처리하는 동안에도 프로세서를 계속 가동할 수 있습니다.

기업및 엔터프라이즈 컴퓨팅을 위한 성능

혁신적인 AMD-760™ MPX 칩셋을 채용한 AMD 애슬론 MP 프로세서는 이중 프로세서 플랫폼 상에서 탁월한 성능을 발휘합니다. AMD-760 MPX 칩셋은 AMD 애슬론 MP 프로세서 제품군을 위한 고성능 2-웨이 멀티프로세서 코어 로직 솔루션입니다. 이 칩셋은 향상된 266MHz 시뵀?버스, DDR 메모리 기술 지원, AGP-4x 그래픽 인터페이스 및 고속 66MHz/64비트 PCI 버스 등을 통해 고성능을 실현하고 있습니다. 메모리 및 I/O 컨트롤 내 정교한 코어 로직과 함께 시스템 및 전원관리를 고려해 설계한 AMD-760 MPX 칩셋은 멀티프로세서 서버와 워크스테이션 플랫폼을 위한 강력한 솔루션을 탄생시켰습니다. 이 플랫폼은 멀티쓰레디드, 미션 크리티컬 애플리케이션 실행을 최적화함으로써 탁월한 멀티프로세싱 성능을 제공해 기업이 한 차원 높은 생산성을 달성할 수 있도록 합니다. QuantiSpeed 아키텍처, Smart MP 기술 및 AMD-760 MPX 칩셋을 채용한 AMD 애슬론 MP 프로세서는 이러한 이상적인 결합을 통해 워크스테이션과 서버가 안정적인 멀티프로세싱 성능을 발휘할 수 있도록 합니다.
AMD 고유의 안정적인 플랫폼인 소켓 A는 인프라 이탈을 최소화하고 정보가전 및 범용 서버에서부터 고성능 워크스테이션에 이르는 다양한 상용 컴퓨팅 요구를 지원하는 손쉬운 업그레이드 경로를 제공해 IT 관리자들이 기업 관리 비용을 절감할 수 있도록 합니다. AMD의 소켓 A 플랫폼은 엔터프라이즈 고객들이 현재의 요구 사항을 처리하는 것은 물론 장기적인 투자 보호 및 미래 성장 경로를 보장할 수 있도록 지원합니다.

새로운 유형의 프로세서 기술

AMD 애슬론 MP 프로세서의 뛰어난 아키텍처 기능은 서버 및 워크스테이션에서 탁월한 성능을 발휘할 수 있도록 지원합니다. 이 프로세서의 뛰어난 아키텍처적인 특징은 다음과 같습니다.

QuantiSpeed™ 아키텍처
Smart MP 기술
에러정정코드(ECC, Error Correcting Code )를 지원하는 첨단 266MHz FSB
총 384K의 고성능, 풀 스피드 캐시
3DNow!™ Professional 기술(72개의 명령어, SSE와 완벽하게 호환)
DDR (Double Data Rate) 메모리 지원
안정적인 소켓 A 인프라

제품스팩



동작 클럭
1.53GHz

제조공정
0.18 micron 구리공정

소켓타입
Socket A

Voltage
1.75v

QuantiSpeed™ Architecture


정수 파이프라인
3

부동 소수점 파이프라인
3

L1 캐시
128K

L2 캐시
256KB (on-chip)

System bus speed
266MHz

3D Enhancement instructions


3DNow!™ Professional


Cache/prefetch controls
Yes

Streaming controls
Yes

DSP/comm extensions
Yes










AthlonXP(애슬론XP)

QuantiSpeed™ 아키텍처를 채용한 AMD 애슬론™ XP 프로세서는 차세대 컴퓨팅 플랫폼을 지원함으로써 첨단 애플리케이션을 위한 탁월한 성능과 환상적인 컴퓨팅 경험을 제공합니다. AMD 애슬론™ XP 프로세서는 AMD 애슬론 프로세서 제품군의 최신 제품으로서 고성능 데스크탑 시스템 상에서 실행되는 첨단 소프트웨어 애플리케이션의 연산 집약적인 요구 조건을 지원하도록 설계되었습니다.

AMD는 클럭 사이클 당 수행할 수 있는 작업량을 증가시키는 동시에 동작 주파수를 향상시킴으로써 획기적인 성능 향상을 실현했습니다. 그 결과 사이클 당 대용량의 작업을 수행하고 높은 동작 주파수로 실행되는 프로세서 설계가 탄생했습니다. 이는 업계 최고 수준의 애플리케이션 성능을 제공하는 가장 이상적인 결합이라고 할 수 있습니다.

x86 플랫폼 중 가장 강력한 디지털 미디어 경험 제공
AMD 애슬론 XP 프로세서를 이용할 경우 게임 및 DVD와 같은 디지털 엔터테인먼트를 풍부한 색감과 부드러운 그래픽, 그리고 박진감 넘치는 사운드로 실감나게 즐길 수 있게 됩니다. 이 프로세서는 한층 기능이 강화된 특수 서라운드 음향을 지원하기 때문에 생생한 오디오 경험을 만끽할 수 있도록 합니다. AMD 애슬론 XP 프로세서는 사실적인 사진, 자연스러운 영상, 그리고 풍부한 음향을 제공함으로써 연결된 디지털 장비 및 컨텐츠를 최대한 활용할 수 있도록 합니다. Windows XP의 다양한 기능과 AMD 애슬론 XP 프로세서의 탁월한 기능이 결합되어 스트리밍 오디오와 비디오를 보다 자연스럽게 처리함으로써 환상적인 인터넷 경험을 누릴 수 있게 될 것입니다.

Microsoft? Windows? XP를 위한 맞춤 설계
AMD 애슬론 XP 프로세서는 Windows의 이전 버전은 물론 Microsoft Windows XP 실행 환경에서도 놀라운 성능을 발휘합니다. AMD 애슬론 XP 프로세서의 막강한 성능과 강력한 기능을 통해 사용자들은 Windows XP에서 제공하는 멀티태스킹 및 사용자 전환 기능을 최대한 활용할 수 있습니다. 마이크로소프트는 특히 AMD 애슬론 XP 프로세서를 위해 Windows XP용 DirectX 8.0 인터페이스를 최적화했습니다. AMD 애슬론 XP 프로세서의 혁신적인 QuantiSpeed 아키텍처는 Windows XP 애플리케이션이 한 차원 높은 성능을 발휘할 수 있도록 지원합니다. AMD와 마이크로소프트는 상호 협력을 통해 AMD의 3DNow! Professional 기술에 맞춰 Media Encoder 8.0과 같은 애플리케이션을 최적화함으로써 사용자들이 Windows XP가 제공하는 풍부한 기능을 만끽할 수 있도록 했습니다.

AMD 애슬론 프로세서들은 Windows XP 운영 체제의 설계와 개발 과정에서부터 계속 사용되어 AMD 프로세서 기반 시스템이 탁월한 OS 호환성을 갖출 수 있게 되었습니다. AMD와 마이크로소프트의 긴밀한 협력 관계는 10년 전 최초의 Windows 버전이 출시되었을 당시부터 시작되었습니다. 지난 수년 동안 AMD 프로세서는 Windows 애플리케이션을 위한 가장 안정적인 PC 시스템을 구현함으로써 엔드 유저의 생산성 향상과 만족을 향상시켜왔습니다
미래의 기술을 현재에 구현
AMD 애슬론 XP 프로세서는 다음과 같은 탁월한 아키텍처 특징을 통해 뛰어난 수준의 성능을 보장할 수 있게 되었습니다.

- QuantiSpeed 아키텍처
- 총 384K의 고성능 풀 스피드(Full-Speed) 캐시
- ECC(오류 수정 코드)를 지원하는 첨단 266MHz FSB
- 3DNow! Professional 기술(72개의 명령어, SSE와 완벽하게 호환)
- DDR 메모리 지원
- 신뢰성이 입증된 소켓 A 인프라
모델명 애슬론XP 1700+ (1.47Ghz/FSB266/Bulk)
제조사 AMD
타입 소켓 A 타입
내부클럭속도 1.47 GHz
외부클럭속도 266 MHz
생산기술 0.18 미크론
내부캐시(L1) 128KB
내부캐시(L2) 256KB
동작전압 1.75







Athlon(애슬론)

Athlon AMD의 7세대 프로세서로 기존 AMD의 칩의 형태가 소켓형인것과는 달리 K7은 슬랏A라는 독특한 구조를 갖는다.슬랏A는 인텔의 슬랏1과 비슷한 구조이지만 서로 호환되지 않는다. FSB(frontsidebus)가 펜티엄3의 2배인 200MHz로 이는 DEC의 알파 EV-6 기술을 AMD사가 라이센스하여 이루어진 것이다. 데이터 및 명령어 처리를 위한 내부 캐시의 크기는 각각 64KB로 1차캐시의 양은 총128KB이다. 현재 펜티엄Ⅱ의 1차 캐시가 32KB인것을 감안하면 엄청난 양의 캐시인 셈이다.

애슬론 프로세서는 한사이클(클락)에 9개의 부동 소수점 및 정수 연산을 실행한다. 또 애스론은 3개의 정수 명령어 유닛(Unit)이 있고 유닛 당 2개씩의 명령어를 파이프라인으로 처리하기 때문에 6개의 정수 명령어를 한꺼번에 처리할 수 있으며 부동 소수점에서는 MMX와 3Now! 명령어를 비롯, 3개의 명령어를 처리하는 등 모두 9개의 명령어를 동시에 처리할 수 있다고 한다.

처음에 출시된 애슬론의 2차캐시의 크기는 512KB 이다. 애슬론의 2차 캐시는 코어동작속도에 1/3또는1/2로 동작하며 코어에 내장된 형태가 아니고 펜티엄3(카트마이)처럼 온보드화될 예정이다. 애슬론의 코어 디자인으로는1GHz 이상의 클럭 주파수를 갖는 제품도 가능하다. 애슬론의 또 다른 특징으로는 멀티프로세싱이 가능하다는 것인데, 이는 x86 명령어를 사용하는 비인텔 계열의 CPU로는 유일하다. 멀티프로세싱에 있어 인텔의 서버용 CPU인 제온과 다른 점이 있다면, 포인트-투-포인트(Point-to-point) 방식으로 여러 개의 프로세서(CPU)가 시스템 버스를 공유함으로써 버스의 병목 현상을 줄이고, CPU의 개수에 비례해 성능 향상 효과를 가져온다고 AMD는 밝히고 있다. 애슬론은 슬롯A라는 독자적인 CPU-마더보드 인터페이스를 가지며, 애슬론에 최적화된 칩셋과 마더보드를 사용해야 한다.

현재는 2차캐시를 다이에 집적시켜 성능을 향상시킨 애슬론(썬더버드)이 생산,판매되고 있다. 신형 애슬론(썬더버드)은 소켓A형 인터페이스로 코어와 동일하게 동작하는 256kb 2차캐시를 장착하여 성능이 더욱 향상되었다.






Duron(듀론)

듀론 프로세서의 개요

AMD 듀론™ 프로세서를 기반으로 한 PC는 일상업무를 위한 실용적인 선택입니다. AMD 듀론 프로세서는 사용자 여러분의 모든 소프트웨어와 운영체제를 구동하는데 필요한 기능과 성능의 이상적인 결합을 제공합니다. AMD 듀론 프로세서의 다양한 미래 지향적인 기능이 기업과 가정의 사용자 모두를 위한 PC 솔루션을 제공하고 있습니다.

일상 업무에 적합한 실용적인 기능

AMD 듀론 프로세서는 일상 업무를 위한 실용적인 성능을 제공합니다. 업계의 저명한 상을 수상한 바 있는 고성능 AMD 애슬론 프로세서 제품군에 채용된 핵심 기술을 토대로 개발된 AMD 듀론 프로세서는 여러분의 PC를 위한 탁월한 프로세서 솔루션입니다. AMD 듀론 프로세서는 멀티미디어, 인터넷 브라우징, 비즈니스 관리와 같은 애플리케이션에서 우수한 성능을 발휘합니다. 또한 AMD 듀론 프로세서는 게임과 DVD 재생과 같은 디지털 엔터테인먼트을 위한 뛰어난 성능을 제공합니다.


Microsoft Windows XP 와의 호환성

AMD 듀론 프로세서는 이전 버전의 Windows에서 탁월한 성능을 발휘할 뿐만 아니라 Microsoft Windows XP 실행에서도 탁월한 성능을 제공합니다. 마이크로소프트는 AMD 프로세서를 위해 Windows XP의 DirectX 8.0 인터페이스를 최적화했으며 AMD 듀론 프로세서에 적용된 3DNow!TM Professional 기술을 위해 Windows Media Encoder 8.0과 같은 애플리케이션을 최적화했습니다. AMD 프로세서의 고속 컴퓨팅 성능을 통해 사용자들은 빠른 사용자 변환과 같은 Windows XP의 새로운 기능을 활용할 수 있게 되었습니다.

AMD 프로세서는 Windows XP 운영체제의 설계와 개발단계부터 사용됨으로써 AMD 프로세서에 기반한 시스템은 완벽한 OS 호환성을 제공합니다. AMD와 마이크로소프트의 긴밀한 협력 관계는 Windows의 첫 버전부터 10년 이상 지속되어 왔습니다. 지난 수년 간 AMD 프로세서는 가장 안정적인 Windows 애플리케이션용 PC 시스템을 지원함으로써 사용자의 생산성과 즐거움을 향상시키는데 일익을 담당해 왔습니다.


탄탄한 협력업체의 지원

1969년에 설립된 AMD는 전세계에 1억 7천 5백만 개 이상의 PC 프로세서를 공급했습니다. AMD 프로세서는 Microsoft Windows XP, Windows 98, Windows Me, Windows NTR, Windows 2000은 물론 리눅스(Linux)와 기타 PC 운영 체제와의 호환성을 공고히 하기 위해 광범위한 테스트를 수행하고 있습니다.

AMD는 AMD 프로세서와 Windows XP 운영 체제 간의 호환성 유지를 위해 마이크로소프트와 긴밀한 협력 관계를 유지해 왔습니다. 그 결과, 안정적인 애플리케이션 성능을 제공하고 시스템 중단 시간을 줄인 시스템을 구현할 수 있었습니다. AMD 애슬론 XP 프로세서는 최신 3DNow! Professional과 MMXTM 기술로 한층 강화된 소프트웨어를 포함해 6만 개 이상의 소프트웨어 애플리케이션과 호환됩니다. AMD는 업계 주도적인 하드웨어 및 소프트웨어 기업들과 협력함으로써 광범위한 호환성을 실현하고 있습니다. 또한 자체적으로 엄격한 프로세서 타당성 검사를 수행함으로써 AMD의 명성에 걸맞는 무결성과 사용 편이성을 보장하기 위해 노력하고 있습니다.



고속시스템버스

- AMD 듀론 프로세서는 200MHz FSB(Front Side Bus)를 장착하고 있으며 인텔 셀러론 프로세서 보다 훨씬 높은 버스 대역폭을 제공합니다.
또한 이 고속 시스템 버스는 MP3 인코더, 비디오 인코더, 소프트 DVD 플레이어 및 기본 비디오 편집 패키지와 같은 데이터 처리 애플리케이션 운영시 탁월한 성능을 제공합니다.



정교한 캐시 아키텍쳐

- AMD 듀론 프로세서는 총 192K의 온 칩 캐시를 장착하고 있습니다.
이러한 대형 온 칩 캐시는 정교한 캐시 아키텍처와 결합해 메모리를 많이 사용하는 애플리케이션 상에서 인텔의 셀러론 프로세서보다 훨씬 뛰어난 성능을 발휘하고 습니다.

마찬가지로 기본 3D 컨텐트 제작과 사진 편집 패키지 뿐만 아니라 기업 및 개인 생산성 향상을 위한 애플리케이션에서도 뛰어난 성능을 발휘합니다.



Enhanced 3D NOW 기술

- Enhanced 3D NOW 기술을 이용한 슈퍼스칼라 부동소수 유닛 : AMD 듀론 프로세서는 3개의 부동 소수점 파이프라인을 제공하는 데 반해 인텔은 단 하나의 파이프라인만 제공합니다.

이러한 탁월한 수치 연산 기술은 AMD의 Enhanced 3DNow 멀티미디어 기술과 결합되어 AMD 듀론 프로세서가 그래픽 처리 중심의 애플리케이션 운영시 매우 뛰어난 성능을 발휘합니다.

이러한 애플리케이션으로는 게임 소프트웨어, 엔터테인먼트 제품 뿐만 아니라 웹 디자인 툴 등이 포함됩니다.




제품스팩

- 다수의 병렬 x86 명령 디코더.
- 최첨단 3D성능을 위한 강화된 3DNOW 기술.
- 데이터 이동 집약적인 애플리케이션을 위해 최상 시스템 대역폭을 지원하는 200Mhz 듀론시스템 버스
- 통합 128KB 1차 캐시 및 프로그래머블 고속 후면 2차 캐시 인터페이스를 채용한 고성능 캐시아키텍쳐
- AMD의 Fab25 및 Fab30 웨이퍼 제조공장에서 AMD의 최첨단 0.18 마이크론 6계층 메탈공정 기술을 이용해 제조
코어 종류 Morgan
코어 전압 1.75 v
제공 공정 0.18 Micron
시스템 버스 200MHz
소켓 규격 Soket A (462 pin)







K7 (1999년)

AMD 의 K7은 공개된 내용만으로는 인텔의 프로세서를 능가하는 제품으로 알려져 있습니다. 500MHz 이상의 클럭속도와 200MHz의 시스템 버스 속도를 자랑합니다.

L2캐시의 크기는 512KB 이상이며 제품에 따라 8MB 까지 확장할 수 있습니다. K7의 또 다른 특징으로는 멀티프로세싱이 가능하다는 것 인데, 이는 x86 명령어를 사용하는 비인텔 CPU로는 유일합니다.

멀티프로세싱에 있어 인텔의 서버용 CPU 제온과 다른점 있다면, 포인트-투-포인트(Point-to-Point) 방식으로 여러 개의 프로세서가 시스템 버스를 공유함으로써 버스의 병목현상을 줄이고, CPU의 개수에 비례해 성능 향상 효과를 가져온다고 AMD는 밝히고 있습니다.

K7는 슬롯A라는 독자적인 CPU-메인보드 인터페이스를 가지며, K7에 최적화된 칩셋과 메인보드를 사용해야 합니다.
0.25미크론 공정의 제품은 99년 상반기에 출시됐으며 0.18미크론 공정의 제품은 하반기 중 독일의 새로운공장에서 생산될 계획을 가지고 있습니다.











K6-3 (1999년)

인텔의 셀러론에 대항해 개발된 제품으로, Sharktooth라는 코드명으로 불렀습니 다. K6-2와 동일한 코어를 사용하나 64KB의 L1캐시가 사용되며, L2캐시가 다이에 내장된다는 점이 다릅니다.

일반 업무용 프로그램에서는 인텔의 동급 펜티엄-II 프로세서보다 속도면에서 우수하다는 평가를 듣고 있지요. 이는 AMD의 Tri-Level 캐시 설계에 기인한 것으로, 데스크톱용으로는 400MHz 와 450MHz가 있습니다.













K6-2 (1998년)

K6의 기본골격에 "3D Now!" 라고 하는 21개의 새로운 명령어를 추가시켜 만든 CPU 입니다. K6-2는 950만 개의 트랜지스터를 집적했으며, 0.25미크론 공정으로 만들어졌습니다.

3D-Now! 기술 지원으로 3D 게임 성능을 향상시켰으며, 100MHz FSB 지원으로 L2 캐시 및 메모리에 대한 엑세스 속도를 최고 50%까지 높였습니다.

마이크로소프트사는 다이렉트 6.0에 3D Now! 기술을 포함시켰기 때문에 호환성 문제는 걱정하지 않아도 될 것 같습니다.











K6 (1997년)

0.25미크론 공정에 MMX를 지원하는 K6는 K5의 후속 모델로 1997년 4/4분기 부터 발표되었습니다.
K5에 비해 MMX 기술과 내장 캐시, 병렬적으로 처리할 수 있는 명령어가 추가되었습니다. AMD K6는 발표당시, 일반 프로그램에서 동급의 펜티엄MMX와 비교할 때 우수한 성능을 발휘하며 펜티엄-II 급의 CPU와 비교해도 성능 차가 별로 없다고 소개 되었습니
다.

하지만 실제 테스트에서는 대부분이 호환칩이 그렇듯이 부동 소수점 연산 능력이 동급의 인텔 펜티엄MMX보다 다소 낮은 것으로 나타났습니다.

하지만 펜티엄이 사용하는 소켓 7에서 동작하고 펜티엄보다 가격이 저렴하여 OEM용으로 많이 채용되기 시작했습니다. AMD는 K6부터 P-Rating을 그만두고 실제 외부 클럭 속도로 제품의 성능을 나타내기 시작했습니다.











K5 (1996년)

K5는 펜티엄급 CPU로, AMD가 자사 최초로 독립적인 제품으로 개발한 것이라는 데 의미가 있다. (그 이전엔 인텔 호환 칩셋을 생산했답니다.)

그러나 K5는 인텔의 펜티엄보다 그리 뛰어나지 못했으며, FPU를 이용한 3D프로세싱 영역에서도 사이릭스 6x86보다 못했다는 평입니다.









펜티엄-IV CPU

인텔의 프로세서는 95년 펜티엄프로코어의 프로세서를 선보인 이후로 이름만 조금씩바뀌었을뿐 사실 내부적인 구조는 크게 변하지 않았다. 인텔은 근본적으로 프로세서 설계를 다시 하기보다는 FSB(Front Side Bus)를 66MHz에서 100MHz, 그리고 조금은 비정상적인 133MHz로 끌어올리고 내부의 캐쉬 크기를 조절하고 속도를 높여 성능향상을 꽤했다. 단순히 프로세서의 정수연산 속도만을 높이지 않고 MMX(Multimedia eXtension)를 추가하는 등 변화하는 인터넷 환경과 멀티미디어 환경에 맞추려 노력해 왔다.

이렇게 꾸준히 성능을 개선해 오긴 했지만 획기적인 변화는 부족했다. 이것은 인텔이 프로세서 시장에서 부동의 1위 자리를 꾸준히 지켜 획기적인 변화의 필요성을 크게 느끼지 못하기 때문이기도 했다.

물론 그 이면에 프로세서 자체의 문제만 있는 것은 아니다. CPU가 제대로 작동하기 위해서는 제대로 쓸 수 있는 메인보드칩셋이 반드시 필요하다. BX칩셋이후의 인텔 칩셋은 그리 성공적이지 못했으며 심지어 급조된 MTH(Memory Translation Hub)를 달고 나온 820칩셋은 전량 리콜되는 초유의 사태를 맞이 했다.

새로운 CPU가 선보이더라도 메인보드 칩셋이 없어 제대로 쓸 수 없는 아이러니한 상황이 생기기도 했다.

한편, 호시탐탐 기회를 엿보던 강력한 경쟁자 AMD에게는 지난 얼마간은 최고의 시간이었다. 새로운 기술로 중무장한 AMD의 애슬론과 썬더버드 그리고 듀론 프로세서들은 더 이상 AMD가 인텔의 그늘에 가린 만년 2인자가 아니라 충분히 인텔의 대안이 될 수 있음을 증명해 보였기 때문이다. 심지어는 1,000MHz, 좀 더 멋있게
말하면 1GHz를 돌파한 최초의 프로세서는 인텔 펜티엄 III가 아니라 AMD 애슬론이었다.

인텔에게 있어 속도 경쟁에서 뒤졌다는 것은 큰 충격이었고 AMD를 능가하기 위해 만들어진 펜티엄 III 1.13GHz는 결함으로 인해 전량 리콜되고 생산 중단되는 시련을 겪기도 했다.

이런 시행착오를 겪으면서 인텔은 더 이상 지금의 펜티엄 III 아키텍처로서는 클록속도를 높여 고성능 프로세서를 만드는 것이 불가능하다고 판단한 듯하다. 그래서 개발된 것이 새로운 IA-32프로세서 펜티엄4이다.

이러한 특징을 인텔에서는 최근의 인터넷 확산추세에 맞추어 넷 버스트 아키텍처라고 좀 더 멋있게 부르고 있다. 이 가운데 핵심은 하이퍼 파이라인 기술이다. 펜티엄 III의 경우 모두 10단계의 파이프라인인데 비해서 펜티엄 4의 파이프라인은 20단계이다. 이것은 단위 클록당 처리할 수 있는 명력어의 개수를 늘리기 위한 것이다. 언뜻 보면 명령어를 처리하는 파이프라인이 두 배로 늘어 처리속도가 무척 빨라질 것 같지만 나름대로 단점이 있다.

펜티엄4는 인텔의 기존의 x86아키텍쳐를 버리고 새롭게 설계한 완전32비트 프로세서이다. 2차캐시 크기는 기존 펜티엄3와 같은 256KB이지만 FSB가 400Mh 로 기존 펜티엄3의 3~4배에 달한다. 펜티엄3의 SSE기능을 개량한 SSE2지원, 하이퍼 파이프 라인 기술, 실행추적캐시, 동적 실행엔진등 인텔의 많은 기술이 총 동원 되었다. 0.18미크론 공정으로 제조되며 4천2백만개의 트랜지스터가 집적되어있다. 처음 발표된 클락은 1.4Ghz.1.5Ghz로 클락도 많이 높아 졌다.

펜티엄 4에 적용된 신기술(NetBurst)과 제품 스펙

- 하이퍼 파이프 라인 기술
기존 펜티엄인 경우 5단계의 파이프라인 기술이 적용되었고 펜티엄3 같은 경우는 10단계의 파이프라인 사용한다. 이번 발표된 펜티엄4는 펜티엄3의 2배인 20단계의 파이프 라인을 사용하기 때문에 분기 예측이 높아지는등 더욱 빠른 데이타 처리가 가능하게 된다.

- Execution Trace Cache and the Dynamic Execution Engine
파이프라인이 길어 지면서 분기 예측 비율은 높아 지지만 만약 실패하게 되면 파이프 라인 20단계를 다시시작 해야 하는 문제점이 생긴다. 이런 오버헤드를 극복하기 위해서 인텔은 Execution Trace Cache and the Dynamic Execution Engine라는 기술을 도입하게 되는 것이다. 

- 400Mhz시스템 버스 사용
펜티엄3 같은 경우 FSB가 100,133Mhz로 경쟁 제품인 AMD의 애슬론의 200Mhz보다 대역폭이 낮기 때문에 성능에 제약을 받았었다. 더욱이 최근의 애슬론 같은 경우는 266DDR램을 지원하게 되어 더욱 대역폭이 차이 나게 된다. 하지만 이번에 발표한 펜티엄4에는 400Mhz의 FSB가 적용되어 훨씬 빠른 시스템 환경을 만들게 된다.

- SSE2(Streaming SIMD Extension 2)
인텔이 96년 처음 MMX라는 명령어 코드를 발표한 이후에 꾸준히 발전 시켜 SSE로 발전 시켰고 그 결과 SSE는 펜티엄3에 적용되었었다. 이번에SSE2도 펜티엄3에 사용된 SSE의 명령어를 개선하여 만든것으로써 144개의 명령어로 이루어 워 있다. 처음 펜티엄3가 나왔을 때도 SSE 기술에 최적화된 소프트웨어의 부족으로 최적에 성능을 얻지 못한 전례로 보아 펜티엄4도 비슷한 결과를 얻을 것으로 보인다. 따라서 펜티엄4의 실질적인 성능은 아무래도 조금은 더 시간을 갖고 두고 봐야 할 것 이다.

인텔 넷 버스트(Net Burst) 아키텍처 펜티엄4의 기술적인 특징 - 하이퍼 파이프라인 기술(Hyper Pipelined Techndogy)
- 고속실행엔진
- 400MHz FSB
- 더블 펌프 ALU(Arithmetic Logic Unit : 산술논리연산장치)
- 개선된 캐쉬
- 명령어가 추가된 SSE2(Streaming SIMD Extension2)









B / EB 기호를 알아보자

전에는 MHz로 성능을 구분할 수 있었지만, 이제는 E·B·EB 라는 기호로 구분이 바뀌고 있는 것입니다.
사실 이런 기호 표시는 기존의 카트마이에서 코퍼마인으로 코어를 변경하면서 일시적으로 생긴 제품 구분법입니다. 원래대로 하면 100MHz의 FSB와 0.25미크론의 카트마이는 133MHz의 FSB와 0.18미크론의 코퍼마인으로 바로 전이되어야 하지만, 장착 방시의 급격한 변화로 인한 혼란과 코퍼마인의 수율에 대한 문제 때문에 중간급의 CPU가 나오고 있는 것입니다.

코퍼마인의 원래 사양인 0.18μ 공정과 133MHz를 충족시키는 제품은 EB로 표시됩니다. 여기서 E는 0.18μ 공정을, B는 133MHz의 FSB를 뜻합니다.

또한 0.18μ의 코퍼마인 코어는 256KB의 온다이 풀스피드 L2개시(코어속도와 동일한 클럭으로 동작)를 사용하기 때문에 E와 EB 버전은 256KB의 온다이 풀 스피드 L2캐시를, B는 기존의 512KB의 하프 스피드 외부 L2캐시 (코어 속도의 1/2 클럭으로 동작) 를 사용합니다.
반응형

'컴, 하드웨어, IT' 카테고리의 다른 글

CPU와 BUS의 발전사(PC위주)  (0) 2007.06.27
FSB란?  (0) 2007.06.27
오버클럭 관한 모든 궁금증  (0) 2007.06.27
Posted by Real_G