Thứ Năm, 9 tháng 5, 2013

Một số thông tin về kiến trúc Atom Silvermont: vũ khí mới của Intel trên thị trường di động

Intel_Silvermont_anh_11

Intel mới đây đã chính thức công bố một vi kiến trúc mới mang tên Silvermont để dùng trong các vi xử lí Atom. Vi kiến trúc này đã được công ty phát triển trong suốt 5 năm ròng rã và mãi đến hôm nay nó mới được trình làng. Nếu như vi kiến trúc Bonnel (2008) và Saltwell (2009) là thứ mà Intel sử dụng để đặt những bước chân đầu tiên vào thị trường thiết bị di động thì Silvermont là vi kiến trúc giúp Intel đi thêm những bước dài trong mảng này. Theo lời Intel, Silvermont cho hiệu năng cao gấp 3 lần kiến trúc Atom hiện nay nhưng lại tiêu thụ điện thấp hơn đến 5 lần, đầy hứa hẹn để sử dụng trên smartphone và tablet. Trong bài viết dưới đây, mình sẽ chia sẻ với các bạn một số thông tin quan trọng về vi kiến trúc này.

Vi kiến trúc là gì?

Trong ngành khoa học máy tính, vi kiến trúc (microarchitecture, viết tắt là µarch, uarch, còn được gọi là tổ chức máy tính) là cách mà một tập lệnh chỉ dẫn (instrution set) được tích hợp vào vi xử lí. Khi tạo ra các vi kiến trúc, người ta thường để ý đến công đoạn mà CPU sẽ lấy dữ liệu từ các loại bộ nhớ, thực thi dữ liệu và ghi lại kết quả vào bộ nhớ. Ngoài ra, các đơn vị thực thi (execution unit) cũng là những thành phần cơ bản của một microarchitecture, chúng bao gồm bộ phận tính toán logic, bộ phận xử lí dấu chấm động, đơn vị tải/lưu trữ... Các kĩ sư cũng nghiên cứu về kích thước, độ trễ và tốc độ truyền tải của bộ nhớ trong khi thiết kế vi kiến trúc.

Intel trước đây đã có nhiều vi kiến trúc dùng cho các CPU của họ, điển hình là Nahalem, Sandy Bridge, Ivy Bridge, Haswell cho các chip Intel Core i, còn Silvermont thì dành cho chip Intel Atom. Nói ngắn gọn lại, vi kiến trúc là thiết kế để giúp vi xử lí tận dụng tốt nhất các chỉ dẫn cũng như những công nghệ mà hãng sản xuất chip tích hợp vào nó.

Các thế hệ vi kiến trúc dành cho CPU Atom

Intel_Silvermont_anh_1

Vi kiến trúc đầu tiên được Intel xây dựng cho các chip Atom là Bonnel, ra mắt năm 2008 (mặc dù nó được thiết kế từ những năm 2004). Những con chip này được sản xuất trên quy trình công nghệ 45nm. Một vài chip thuộc gia đình Bonnel gồm có Atom 230, 330, N270, N280. Nếu bạn nhớ lại cách đây khoảng 4-5 năm thì những CPU Atom này xuất hiện rất phổ biến trong làn sóng netbook cực kì thịnh hành vào thời điểm đó. Bonnel thuộc pha "tick" trong chu kì ra mắt "tick-tock" của Intel, tức đại diện cho sự thay đổi lớn và mang tính cốt lõi.

Đến năm 2009, Intel tiếp tục công bố vi kiến trúc Saltwell, một phiên bản của Bonnel nhưng được làm mới lại để tương thích với quy trình 32nm. Một số chip Atom sử dụng Saltwell bao gồm Intel Atom D2500, D2550, D2600, D2700, D2800. Những chip Atom dành cho smartphone, tablet mới ra mắt gần đây như Intel Atom Z2420 (tên mã Lexington), Atom Z2460, Z2480 (thuộc nền tảng Medfield), Atom Z2760 (nền tảng Clover Trail), Z2520, Z2560, Z2580 (Clover Trail+) cũng đều sử dụng kiến trúc Saltwell. Saltwell thuộc pha "tock", tức chỉ là bản cải tiến của Bonnel ở pha "tick".

Ngày 6/5/2013, Intel giới thiệu thế hệ vi kiến trúc thứ ba dành cho Atom, đó là chính Silvermont. Các CPU dùng Silvermont sẽ được sản xuất trên quy trình 22nm. Trong thời gian tới, Silvermont sẽ được sử dụng làm nhân cho những chip Atom mang tên mã Bay Trail (dành cho tablet), Merrifield (dành cho smartphone) và Avoton (dành cho server). Silvermont có thể dùng trong rất nhiều phần cứng, từ xe hơi cho đến máy chủ, tuy nhiên ưu tiên hàng đầu của Intel đối với vi kiến trúc này là smartphone rồi đến tablet. Theo dự kiến, đến cuối năm nay những chiếc tablet đầu tiên dùng CPU Silvermont sẽ ra đời, còn điện thoại thì phải đợi đến năm sau. Và vì Silvermont thuộc vào pha "tick", nó mang trong mình rất nhiều điểm nâng cấp.

Tiếp theo Silvermont sẽ là Airmont, thuộc pha "tock". Dự kiến Airmont sẽ trình làng vào năm 2014 hoặc 2015 và được tối ưu cho các CPU Atom 14nm.

Tiến trình 22nm

Để hiểu về Silvermont, trước hết chúng ta cần biết về quy trình 22nm mà Intel dùng để sản xuất các SoC của mình. Hai năm trước, Intel giới thiệu những bóng bán dẫn 3 cổng (3D tri-gate transitor) và đến năm ngoái thì nó được mang lên các CPU Ivy Bridge, tất nhiên là cũng được sản xuất bằng quy trình 22nm. Tuy nhiên, quy trình này không phù hợp cho các CPU dùng trong smartphone và tablet, do đó Intel mới quyết định xây dựng hai phiên bản, bao gồm P1270 để sản xuất các CPU 22nm, còn P1271 để sản xuất các SoC 22nm tiết kiệm điện. Silvermont dùng quy trình P1271.

Về cơ bản thì cả P1270 lẫn P1271 đều có thể tạo ra các bóng bán dẫn ba cổng với hiệu năng cao và năng lượng tiêu thụ thấp. Ở ngưỡng điện thế cao, bán dẫn 22nm 3D giúp chip tiết kiêm 25% đến 35% năng lượng. Ở mức 1V, quy trình 22nm giúp cải thiện hiệu năng 18%, còn khi giảm xuống điện thế thấp 0,7V thì hiệu năng nhanh hơn đến 37% so với bán dẫn 32nm. Nói cách khác, Intel có thể làm cho chip của mình nhanh hơn nhưng không tiêu thụ nhiều điện hơn chip 32nm.

Bộ nguồn Out-of-order execution (OoOE) mới

Với Silvermont, Intel cho biết hãng đã tích hợp một bộ máy thực thi Out-of-order execution (OoOE) mới "tốt nhất trong các sản phẩm cùng tầm" mà sử dụng một luồng xử lí.

Vậy OoOE là gì? Ở cấp độ cao, nhiệm vụ của CPU là lấy chỉ dẫn và dữ liệu từ chương trình mà nó đang chạy trong bộ nhớ (register, cache, RAM), thực thi chúng để tạo ra kết quả, sau đó ghi kết quả trở lại vào bộ nhớ. Trong các kiến trúc In-order, CPU sẽ lấy các chỉ dẫn ra khỏi bộ nhớ đúng theo thứ tự mà chương trình đã sắp đặt, từ đầu cho đến đuôi. Vấn đề với in-order đó là nó có khả năng xảy ra độ trễ trong khi CPU lấy dữ liệu để tiếp tục chạy chỉ dẫn kế tiếp. Vi kiến trúc Intel Bonnel, chip ARM11, ARM Cortex A8 và nhân Scorpion của Qualcomm đều đi theo dạng in-order.

Còn với Out-of-order, CPU có thể lấy ngay dữ liệu và chỉ dẫn nào đang sẵn có để chạy nên loại bỏ được "thời gian chết", không đòi hỏi phải chạy đúng theo thứ tự. OoOE đáp ứng được nhu cầu ngày càng cao về hiệu năng hoạt động, và khi kết hợp với các công nghệ bán dẫn mới, các nhà sản xuất đã cho ra các phiên bản OoOE dựa trên kiến trúc của mình, chẳng hạn như ARM Cortex A9, Qualcomm Krait 200/300 (gần gần OoOE) và Cortex A15 (OoOE thật sự). Silvermont với bộ nguồn mới cũng được xếp vào loại Silvermont thật sự. Nhờ có kiến trúc out-of-order mà Silvermont có thể đạt hiệu năng đơn luồng cao hơn 30% so với Bonnel.

Thực chất thiết kế out-of-order khiến mức độ tiêu thụ năng lượng và kích thước đế chip bị tăng lên, do đó Intel đã phải sử dụng thiết kế in-order cho các chip Atom Bonnel. Còn với Silvermont, hãng đã có trong tay tiến trình 22nm nên có thể giải quyết được hai vấn đề nói trên.

Pipeline mới

Intel_Silvermont_anh_2

Pipeline là thuật ngữ dùng để chỉ việc "cắt" một tác vụ lớn thành nhiều tác vụ nhỏ để thực thi. Pipeline cho phép nhiều chỉ dẫn được chạy cùng lúc với nhiều giai đoạn khác nhau, chúng ta không phải chờ đến khi chỉ dẫn 1 được thực thi xong thì mới thực thi tới chỉ dẫn 2. Bạn có thể tưởng tượng Pipeline giống như một dây chuyền sản xuất xe hơi. Nếu như nhà sản xuất đợi chiếc đầu tiên được hoàn thiện mới bắt đầu làm chiếc thứ hai thì hiệu suất quá thấp (không có Pipeline). Thay vào đó, sẽ hợp lí hơn nếu chúng ta làm việc trên nhiều chiếc xe cùng lúc, ở mỗi công đoạn sẽ hoàn thành một phần của chiếc xe (có Pipeline).

Ở Bonnel và Saltwell, mỗi pipeline sẽ có 16 giai đoạn chạy theo thứ tự. Còn ở Silvermont, kiến trúc out-of-order giúp nó rút số giai đoạn xuống chỉ còn khoảng 14. Cũng nhờ đó số cycle bị dự đoán sai từ lúc lấy chỉ dẫn cho đến khi thực hiện chỉ dẫn là 10 cycle, trong khi với kiến trúc thế hệ trước là Saltwell thì con số này lên đến 13. Nói cách khác, Silvermont giúp CPU Atom chạy nhanh hơn, xử lí dữ liệu nhanh hơn, các tiến trình trong máy sẽ giao tiếp hiệu quả hơn từ 5% đến 10% so với Bonnell.

Thiết kế dạng module

Intel_Silvermont_anh_3

Silvermont được thiết kế theo dạng module, mỗi module bao gồm 2 nhân xử lí/2 luồng và có thể tăng lên tối đa 8 nhân nếu lắp nhiều module trên một đế chip. Ngoài ra, trong mỗi module còn có L2 cache tối đa 1MB với băng thông rộng và độ trễ thấp. Bộ nhớ cache L1 cho mỗi nhân thì vẫn giữ ở mức 32KB (data cache) và 24KB (instruction cache).

Silvermont hỗ trợ từng nhân chạy ở xung nhịp độc lập

Ở tất cả các vi xử lí Intel Core, mọi nhân đều bị trói buộc vào cùng một xung nhịp. Trong khi đó, những chip đa nhân của Qualcomm thì từ lâu đã hỗ trợ xung độc lập cho mỗi nhân và Intel trước đây luôn khăn khăng rằng đây là một ý tưởng tồi. Thế nhưng khi ra mắt Silvermont, Intel đã làm một cú quay đầu ngoạn mục khi cho biết mọi nhân trong một module Silvermont có thể chạy ở xung của riêng nó. Nói cách khác, bạn có thể có một nhân Silvermont chạy ở mức 2,4GHz, trong khi nhân khác thì hoạt động ở 1,2GHz. Trong trường hợp các nhân CPU đang chạy ở xung nhịp khác nhau, bộ nhớ cache L2 sẽ chạy theo xung nhịp cao nhất. Tuy nhiên, tính năng độc lập này chỉ là tùy chọn mà thôi.

Tạm biệt FSB, xin chào IDI

Tất cả những chip Atom trước đây đều sử dụng front side bus (FSB) để kết nối CPU với các thành phần khác của hệ thống, còn ở Silvermont thì Intel sử dụng một giao tiếp điểm-đến-điểm (in-die interconnect, hãng gọi là IDI). Đây cũng chính là giao tiếp mà Intel dùng cho các CPU Core i để loại bỏ FSB. Việc áp dụng IDI giúp hiệu năng đơn luồng được cải thiện khoảng hai con số, đồng thời tiết kiệm không gian trên bo mạch cũng như tiết giảm lượng điện tiêu thụ.

Một lợi ích khác của việc "chia tay" FSB và "kết duyên" với IDI đó là nó giúp tăng tính linh hoạt trong việc thiết lập xung nhịp của nhân Silvermont. Trước đây, tỉ số xung nhịp FSB/CPU phải được giữ đều đều mọi lúc, tức là nếu CPU chạy ở xung nhịp rất thấp thì xung FSB cũng bị thấp theo. Còn ở Silvermont, xung nhịp của IDI và CPU không bị trói buộc với nhau, do đó chúng ta vẫn có một băng thông tốt ngay cả khi CPU đang chạy ở xung nhịp thấp.

System Agent mới

Trong vi kiến trúc Silvermont, Intel đã cập nhật các System Agent (chính là North Bridge, chip cầu bắc) để nó truy cập tốt hơn đến bộ nhớ chính. Trong mọi thế hệ kiến trúc Atom trước đây, bộ nhớ ảo chỉ có thể diễn ra theo thứ tự (mặc dù chip Clover Trail có áp dụng một chút OoOE ở đây). Còn với Silvermont, system agent của nó cho phép sắp xếp lại thứ tự các yêu cầu đến từ CPU, GPU, phần cứng ngoại vi.... để tối ưu hóa hiệu năng và chất lượng dịch vụ.

Một số tính năng và tập lệnh mới được Intel mang lên Silvermont
Intel_Silvermont_anh_4Intel_Silvermont_anh_5Intel_Silvermont_anh_6

Chế độ tăng xung nhịp Burst Mode mới

Intel_Silvermont_anh_7

Để tối ưu hóa xung nhịp của các nhân Saltwell 32nm đời trước, Intel đã tích hợp một công nghệ với khả năng "phơi bày" các trạng thái hiệu năng (Performance States - hay P-State, được đánh số từ P0 đến P16, trong đó P0 là mạnh nhất) còn dư ra dựa trên khoảng nhiệt còn trống (available headroom) nhằm tăng tốc xử lí.

Lên tới Silvermont, Intel chuyển sang sử dụng công nghệ "Burst" để quản lí xung nhịp bằng phần cứng tùy vào nhiệt độ, điện năng và công suất của CPU. Chúng ta có thể xem Burst tương tự như công nghệ Turbo Boost vốn được dùng trên nhiều chip Core i5/i7 và nó hiệu quả hơn là biện pháp cũ được sử dụng trên vi kiến trúc Atom đời trước. Intel có tiết lộ thêm rằng thuận toán và kĩ thuật áp dụng Burst khác Turbo Boost, chỉ có ý tưởng về cách hoạt động của chúng là giống nhau là giống nhau.

Nói cụ thể hơn, trên Silvermont sẽ có một đơn vị kiểm soát năng lượng sẽ liên tục theo dõi nhiệt độ, đồng thời đảm đương luôn việc phân bổ năng lượng đến các bộ phận trong SoC. Silvermont sẽ nói cho hệ điều hành biết xung nhịp cơ bản tối đa là bao nhiêu và cứ thế máy tính sẽ chạy. Tuy nhiên, tùy theo các chỉ dẫn và TDP mà xung nhịp của chip có thể tăng lên vượt mức cơ bản để đáp ứng cho một tác vụ nặng nề nào đó. Giống với Sandy Bridge, công suất của Silvermont có thể vượt qua ngưỡng TDP của mình trong một thời gian ngắn nếu nhiệt độ đủ thấp để việc này xảy ra.

Hiệu năng xấp xỉ các chip Penryn

Khi những chip Atom đầu tiên ra mắt, người ta so sánh hiệu năng của nó bằng với các chip Pentium M dành cho máy tính xách tay. Một chip Atom 1,6GHz chỉ đạt hiệu năng xấp xỉ với chip Pentium M 1,2GHz. Vậy còn Silvermont thì sao? Theo trang AnandTech, một chip Silvermont 2,4GHz khi xử lí đơn luồng sẽ có hiệu năng bằng chip Penryn 1,2GHz (Penryn là thế hệ CPU Core 2 Solo, Core 2 Duo, Core 2 Quad, Core 2 Extreme ra đời từ năm 2007 đến 2011). Nếu đưa vào so sánh giữa các máy thực thụ với nhau thì một PC Silvermont sẽ mạnh cỡ một chiếc MacBook Air Core 2 Duo của năm 2010. Lưu ý đây chỉ là xử lí đơn luồng, còn nếu chuyển sang hai luồng thì sức mạnh của Atom Silvermont bốn nhân sẽ vượt xa Penryn.

Như đã nói ở trên, Silvermont sẽ xuất hiện trên các máy tính bảng chạy chip BayTrail và hiệu năng của chúng chắc chắn sẽ rất ấn tượng khi hoạt động trên Android. Còn khi chạy Windows 8 dưới dạng các máy hybrid, convertible thì chưa rõ sẽ ra sao.

Còn một điều thú vị khác mà chúng ta có thể chờ đợi đó là hiệu năng của Silvermont sẽ như thế nào nếu dùng trên smartphone. Mặc dù Intel chưa công bố số liệu, điểm benchmark hay bất kì thứ gì về Silvermont trên chip Merrifieldc nhưng việc mang sức mạnh của một chiếc MacBook Air 2010 vào điện thoại thì cũng tuyệt vời quá đấy chứ.

Nói thêm về Silvermont và máy tính bảng

BayTrail sẽ là SoC được tích hợp vi kiến trúc Silvermont và theo dự kiến, nó sẽ ra mắt vào cuối năm nay. Câu chuyện của Silvermont có lẽ sẽ tươi đẹp hơn nhiều so với CloverTrail bởi vì Windows 8 sẽ được nhận một bản cập nhật lớn vào cuối năm, kèm theo đó là dự tính của Intel trong việc ra mắt cả tablet Android lẫn Windows. Android đóng vai trò cực kì quan trọng để giúp Intel thâm nhập phân khúc máy tính bảng giá rẻ mà CloverTrail không thể làm được vào năm ngoái. Nhiều khả năng máy tính bảng BayTrail Silvermont sẽ có giá cỡ Nexus 7 đến iPad, còn ra ngoài khoảng 500-600$ đó là đến lượt Haswell tung hoành.

Về mặt thiết kế, các máy tính bảng BayTrail sẽ không dày hơn các tablet CloverTrail, thậm chí là trở nên mỏng hơn. Tất nhiên là điều này thì cũng sẽ còn phụ thuộc vào nhà sản xuất máy nữa. Màn hình cũng được kì vọng là sẽ tốt hơn bởi Intel được cho là đang làm việc với các OEM để cân chỉnh màu sắc hiển thị. Cũng nhờ vào hệ thống mạnh hơn mà các máy BayTrail có thể sử dụng độ phân giải cao hơn mức 1366 x 768, thậm chí đạt đến mức Retina của iPad hay 2560 x 1600 của Nexus 10. Như đã nói ở mục System Agent, CPU sẽ đặt làm tốt hơn việc ưu tiên GPU truy cập vào bộ nhớ RAM, nhờ vậy mà viễn cảnh màn hình độ phân giải siêu cao hoàn toàn có thể diễn ra.

Về mặt hiệu năng, Intel chỉ mới công bố số liệu từ chiếc tablet tham chiếu của hãng, và kết quả rất ấn tượng. Bạn có thể xem biểu đồ bên dưới để biết thêm chi tiết, trong đó Intel có so sánh cả trường hợp chạy đơn luồng lẫn đa luồng giữa Silvermont và Saltwell.

Intel_Silvermont_anh_8

Theo biểu đồ này, chip Silvermont có thể cung cấp hiệu năng tối đa (cột peak-to-peak) cao gấp 2 lần so với Saltwell khi chạy đơn luồng, còn ở đa luồng thì chênh lệch lên đền 2,8 lần. Về hiệu năng khi hai vi kiến trúc chạy ở cùng mức năng lượng (iso-power), Silvermont cao hơn Saltwell 2 đến 2,5 lần. Còn nếu xét cả hai vi kiến trúc khi chúng có cùng hiệu năng (iso-perf), chip Silvermont tiêu thụ điện hơn từ 4,4 đến 4,7 lần so với người tiền nhiệm.

Hiệu năng của việc chạy đa luồng của Silvermont chắc chắn sẽ vượt trội hơn Saltwell bởi vì một chip Silvermont có thể được tích hợp đến 4 nhân (8 luồng) trong SoC Bay Trail, trong khi một chip Saltwell chỉ có tối đa 2 nhân (4 luồng) mà thôi.

Intel_Silvermont_anh_9

Trong biểu đồ bên trên, Intel có so sánh chip Silvermont với các đối thủ bốn nhân ARM ở mức 1W và kết quả là hiệu năng của Silvermont cao hơn 1,6 lần (tính trung bình) trong khi lượng điện tiêu thụ được giảm đi khoảng 2,4 lần. Slide thuyết trình ngay bên dưới cũng có nội dung giống như thế, tuy nhiên năng lượng tăng thành 1,5W. Nói tóm lại, chúng ta sẽ có những máy tính bảng Atom mạnh hơn và pin lâu hơn hiện nay, nó thậm chí vượt qua một số "đối thủ" (chưa rõ là ai) dùng nhân ARM.

Intel_Silvermont_anh_10

Lời kết

Silvermont rõ ràng là vũ khí chiến lược mà Intel mang theo để cạnh tranh với các đối thủ trên thị trường thiết bị di động. Tuy nhiên, sự thành công của các smartphone, tablet dùng Silvermont còn phụ thuộc nhiều vào bản thân thiết bị ra sao chứ chỉ một mình Silvermont thì chưa đủ. Tuy nhiên, Silvermont có thể tạo ra một nền tảng vững chắc để thúc đẩy sự phát triển của chip Atom, cũng giống như hồi kiến trúc Conroe mới ra mắt đã làm được cuộc cách mạng về hiệu năng để rồi chúng ta có Penryn, Nehalem, Westmere, Sandy Bridge, Ivy Bridge, Haswell... Nó là một vi kiến trúc mà Intel có thể xây dựng theo chu kì tick-tock của mình. Chúng ta hãy chờ đến cuối năm để xem những máy Silvermont sẽ trông ra sao.