Kiến trúc và thuật toán nén không mất dữ liệu để giảm yêu cầu băng thông bộ nhớ với khả năng dự đoán được cải thiện dựa trên nhiều thuật toán Golomb-Rice DPCM
Jun 19, 2024
Tóm tắt
Trong môi trường điện toán, độ phân giải cao hơn thường đòi hỏi nhiều băng thông bộ nhớ hơn, điều này chắc chắn sẽ dẫn đến mức tiêu thụ điện năng nhiều hơn.
Điều này có thể trở nên quan trọng đối với hiệu suất tổng thể của thiết bị di động và bộ xử lý đồ họa với lượng truy cập bộ nhớ và băng thông bộ nhớ tăng lên.
Có một mối quan hệ chặt chẽ giữa môi trường và trí nhớ. Môi trường nơi con người sống và làm việc sẽ ảnh hưởng đến sức khỏe thể chất và tinh thần cũng như sự phát triển và hoạt động của trí nhớ.
Trước hết, một môi trường tốt có thể thúc đẩy sự phát triển khả năng tư duy và nhận thức của con người. Môi trường làm việc và học tập phải yên tĩnh, ngăn nắp, ấm áp và thoải mái để nâng cao hiệu quả khả năng chú ý và tập trung của mọi người, giúp mọi người dễ dàng tập trung suy nghĩ và ghi nhớ hơn. Nếu môi trường ồn ào, hỗn loạn, đông đúc thì não bộ con người sẽ bị xáo trộn, ảnh hưởng đến hiệu quả học tập và trí nhớ.
Thứ hai, một môi trường tích cực có thể thúc đẩy việc hình thành tâm lý tích cực và cảm xúc tích cực. Trạng thái tinh thần tích cực sẽ cải thiện hiệu quả ý thức và nhận thức của con người, đồng thời cải thiện khả năng sáng tạo và trí nhớ của con người. Ngược lại, một môi trường tiêu cực, chán nản sẽ khiến con người mất đi những cảm xúc tích cực và sự tự tin, từ đó ảnh hưởng đến chức năng trí nhớ của con người.
Cuối cùng, một môi trường an toàn và lành mạnh có thể đảm bảo sức khỏe của cơ thể và bộ não con người, từ đó cải thiện trí nhớ một cách hiệu quả. Cơ thể và tâm trí cần được nghỉ ngơi và tập luyện đầy đủ để cung cấp năng lượng và hỗ trợ tốt hơn cho chức năng trí nhớ. Đồng thời, tình trạng ô nhiễm, độc tố trong môi trường sẽ ảnh hưởng trực tiếp đến sức khỏe thể chất, trí não của con người và đẩy nhanh quá trình suy giảm trí nhớ.
Tóm lại, môi trường tốt là điều kiện quan trọng để chúng ta phát triển trí nhớ. Một môi trường học tập và làm việc được điều chỉnh, tâm lý và cảm xúc tích cực, lành mạnh cũng như một môi trường sống lành mạnh và an toàn đều có thể thúc đẩy tích cực sự phát triển và cải thiện trí nhớ của con người. Có thể thấy rằng chúng ta cần cải thiện trí nhớ và Cistanche có thể cải thiện trí nhớ đáng kể vì Cistanche còn có thể điều chỉnh sự cân bằng của các chất dẫn truyền thần kinh, chẳng hạn như tăng mức độ acetylcholine và các yếu tố tăng trưởng rất quan trọng đối với trí nhớ và học tập. Ngoài ra, Cistanche cũng có thể cải thiện lưu lượng máu và thúc đẩy việc cung cấp oxy, điều này có thể đảm bảo rằng não có đủ dinh dưỡng và năng lượng, từ đó cải thiện sức sống và sức bền của não.

Bấm vào biết cách cải thiện chức năng não
Bài báo đề xuất một thuật toán nén không tổn hao với nhiều mã biến điều chế mã xung vi sai Golomb-Rice để giảm yêu cầu băng thông bộ nhớ. Hiệu quả của việc điều chế mã xung vi sai được đề xuất được nâng cao bằng cách chọn chế độ điều chế mã xung vi sai tối ưu.
Kết quả thử nghiệm cho thấy tỷ lệ nén 1,99 đối với chuỗi hình ảnh mã hóa video hiệu quả cao và phần cứng nén không mất dữ liệu được đề xuất có thể giảm yêu cầu băng thông bus.
Từ khóa: Nén ảnh không mất dữ liệu, kiến trúc phần cứng, giảm băng thông bộ nhớ.
1 Giới thiệu
Khi độ phân giải của các thiết bị di động và bộ xử lý đồ họa (GPU) mới nhất tăng lên nhanh chóng, băng thông bộ nhớ cần thiết để truy cập các hình ảnh được lưu trữ trong bộ đệm khung cũng tăng lên.
Lượng truy cập bộ nhớ tăng lên này ảnh hưởng đến hiệu suất tổng thể và mức tiêu thụ điện năng [1, 2, 9–11], cũng như việc sử dụng băng thông bộ nhớ [3, 12]. Để đạt được mục đích này, các phương pháp nén bộ đệm khung không mất dữ liệu và giảm băng thông bộ nhớ có thể là những cách hiệu quả để trang bị bus hiệu suất cao làm IP.
Nhiều nghiên cứu đã được thực hiện cho mục đích này [4–6]; thuật toán nén không mất dữ liệu với điều chế mã xung vi sai Mã hóa Golomb-Rice (DDPCM-GR), thuật toán nén ảnh không mất dữ liệu thông lượng cao với mã hóa biến điều chế mã xung vi sai Mã hóa GR (DPCM-VSC GR) và thuật toán nén lại với nhiều chế độ DPCM trung bình Mã hóa độ dài bán cố định (MDA-SFL) lần lượt được đề xuất trong [4, 5] và [6].
Bài báo này đề xuất một thuật toán nén không mất dữ liệu với mã ký hiệu biến GR MultiDPCM (MDPCM) để giảm yêu cầu băng thông bộ nhớ. Thuật toán sử dụng MDPCM để dự đoán và mã dấu hiệu biến (VSC) GR để mã hóa entropy [5]. Cấu trúc của bài báo như sau. Phần 2 trình bày tổng quan các nghiên cứu trước đây có liên quan đến chủ đề của luận văn này.
Phần 3 giới thiệu thuật toán MDPCM-GR được đề xuất. Phần 4 trình bày kiến trúc phần cứng nén không mất dữ liệu được đề xuất. Phần 5 trình bày các kết quả xác minh hiệu suất phần cứng và thuật toán đề xuất. Kết luận được đưa ra ở Phần 6.
2 Bối cảnh
Trong phần này, chúng tôi xem xét các công việc liên quan đến kiến trúc phần cứng và thuật toán được đề xuất của chúng tôi. Tất cả các nghiên cứu được đưa vào đều cho thấy rằng họ đã cải thiện hiệu suất dựa trên thuật toán DPCM.
2.1 Thuật toán DPCM
DPCM [7] là một thuật toán được áp dụng rộng rãi để nén dữ liệu có thể đảo ngược. Nó bao gồm giai đoạn dự đoán và mã hóa entropy của các kết quả lỗi dự đoán. Kích thước dữ liệu của pixel đầu vào có thể được giảm bằng cách sử dụng các đặc điểm vị trí không gian của hình ảnh.
DDPCM [8] là thuật toán được ATI đề xuất để giảm kích thước của dữ liệu Z trong đồ họa 3D bằng cách cải thiện DPCM. Thuật toán DDPCM tính toán các giá trị vi sai cho hướng trục x và trục y dựa trên kết quả của thuật toán DPCM.

2.2 DDPCM-GR
DDPCM-GR [4] là thuật toán nén không mất dữ liệu thực hiện DDPCM như một hàm dự đoán và mã hóa GR cho mã hóa entropy forfixed-k, trong đó k là 2. Đối với khối xử lý trong ảnh gốc, DDPCMis được áp dụng.
Đối với dữ liệu lỗi từ DDPCM, mã hóa GR được thực hiện. Mã hóa GR là phương pháp mã hóa entropy áp dụng mã hóa đơn phương thành thương số q, trong đó giá trị đầu vào N được chia cho tham số M và phần còn lại được lưu trữ dưới dạng dữ liệu nhị phân.
2.3 DPCM-VSC GR
DPCM-VSC GR [5] là thuật toán nén thông lượng cao thực hiện DPCM như một chức năng dự đoán và mã hóa VSC GR để mã hóa entropy. Đối với khối xử lý trong ảnh gốc, DPCM 2D được áp dụng.
Giá trị thương số được tính bằng cách chia giá trị kết quả của DPCM cho giá trị $ 2 ∧ k $, trong đó k=0, 1, 2, 3. Giá trị VSC và giá trị mã đơn phân thu được bằng cách thực hiện mã hóa GR và VSC.
Độ dài của dữ liệu nén và khối ban đầu được so sánh sau khi tất cả các giai đoạn đã hoàn thành. Nếu độ dài của dữ liệu nén nhỏ hơn độ dài của khối ban đầu thì dữ liệu nén được tạo bằng cách đóng gói tất cả dữ liệu liên quan.
Dữ liệu liên quan bao gồm giá trị K, giá trị chế độ DPCM, giá trị yếu tố đầu tiên, giá trị còn lại, giá trị dữ liệu đơn nhất và dữ liệu biến đổi cho một dấu. Nếu khối ban đầu dài hơn dữ liệu nén, dữ liệu nén sẽ không được sử dụng và khối ban đầu được giữ nguyên.
3 Thuật toán nén không tổn hao được đề xuất
Phần này giới thiệu luồng thực thi của thuật toán đa DPCMGR (MDPCM-GR) được đề xuất để nén và giải nén.
3.1 Quy trình tổng thể của thuật toán nén và giải nén được đề xuất
Thuật toán MDPCM-GR được đề xuất bao gồm một bộ nén nén dữ liệu gốc và một bộ giải nén để khôi phục dữ liệu đã nén. Quá trình nén diễn ra như sau.
Đầu tiên, MDPCM được thực thi dựa trên dữ liệu khối ban đầu, sau đó chế độ DPCM có chi phí thấp nhất được chọn trong số các chi phí DPCM được tính toán. Cuối cùng, mã hóa VSC GR [5] được thực hiện trên các giá trị lỗi từ MDPCM. Quá trình giải nén tuân theo quy trình nén ngược. Hình 1 thể hiện sơ đồ của các quá trình này.
3.2 Thuật toán nhiều DPCM
Thuật toán MDPCM được đề xuất có thể chọn chế độ DPCM với chi phí tối thiểu bằng cách thực hiện bốn DPCM định hướng khác nhau; chẳng hạn như DPCM ngang và dọc và DDPCM.

MDPCM đề xuất sử dụng DDPCM dọc và ngang, được thực hiện dựa trên DPCM dọc và ngang tương ứng. Khi thực hiện DDPCM, hàm dự đoán tối ưu được chọn làm kết quả của hàm dự đoán và chi phí mã hóa entropy cho kết quả của hàm dự đoán được tính dựa trên tổng các giá trị tuyệt đối của kết quả DPCM.
Những lợi ích của MDPCM được đề xuất như sau. Đầu tiên, vì DPCM và DDPCM được áp dụng cả theo chiều ngang và chiều dọc, nên nó được dự đoán cho các hình ảnh có cả vị trí không gian theo chiều ngang và chiều dọc.
Thứ hai, do DDPCM, thực hiện một DPCM bổ sung, được áp dụng cho thuật toán đề xuất, nên nó được dự đoán cho hình ảnh có sự khác biệt về điểm ảnh nhanh. Cuối cùng, chi phí để áp dụng MDPCM chỉ là 2 bit, rất thấp.
4 Kiến trúc phần cứng nén không mất dữ liệu được đề xuất
Phần này giới thiệu kiến trúc phần cứng nén không mất dữ liệu được đề xuất và mô tả từng mô-đun cấu hình cũng như chi tiết hoạt động của nó.
4.1 Kiến trúc phần cứng tổng thể của nén không mất dữ liệu được đề xuất
Như được hiển thị trong Hình 2, kiến trúc phần cứng nén không mất dữ liệu được đề xuất bao gồm các đơn vị sau: đơn vị MDPCM để thực thi MDPCM; đơn vị chuyển đổi dấu hiệu để chuyển đổi giá trị âm từ kết quả DPCM thành giá trị dương; đơn vị đóng gói dữ liệu để đóng gói dữ liệu nén; đơn vị mã hóa song songVSC; bộ chia K; đơn vị tính chi phí cho kết quả chia giá trị K; và bộ mã hóa GR song song để mã hóa song song GR.

4.2 Kiến trúc phần cứng tổng thể của Giải nén không mất dữ liệu được đề xuất
Hình 3 cho thấy kiến trúc phần cứng giải nén không mất dữ liệu tổng thể được đề xuất, bao gồm các đơn vị sau: đơn vị InvMDPCM song song để thực hiện MDPCM nghịch đảo song song; bộ chuyển đổi dấu để chuyển đổi dấu thông qua dữ liệu dấu và dữ liệu cường độ; bộ giải mã GR song song để giải mã GR song song; bộ phát hiện 0 để kiểm tra xem giá trị lỗi DPCM có phải là 0 hay không; bộ giải mã VSC song song để thực hiện giải mã VSC song song; một bộ phận giải nén dữ liệu giúp giải nén dữ liệu đã nén; và bộ chia đơn phân/VSC có thể phân chia dữ liệu đơn nhất và VSC. Phần cứng của giải nén không mất dữ liệu được đề xuất được thực hiện như sau.
Đầu tiên, để giải nén dữ liệu đã nén, bộ giải nén dữ liệu sẽ giải nén dữ liệu đầu vào. Dữ liệu VSC đơn nhất chưa phân tách nhận được từ bộ giải nén được chia thành dữ liệu đơn nhất và dữ liệu VSC trong bộ tách VSC đơn nhất.
Dữ liệu đơn phân được phân tách được truyền đến bộ giải mã GR song song và bộ phát hiện số 0, trong khi dữ liệu VSC phân tách được truyền đến bộ giải mã VSC song song.
Bộ phát hiện 0 kiểm tra xem giá trị lỗi DPCM có bằng 0 hay không dựa trên dữ liệu đơn nhất và dữ liệu còn lại. Kết quả không phát hiện được gửi đến thiết bị giải mã VSC song song, thiết bị này sẽ tái tạo lại dữ liệu đã ký thông qua kết quả không phát hiện 0 nhận được và giải mã VSC. Dữ liệu đơn nhất được giải mã song song bởi bộ giải mã GR song song để khôi phục dữ liệu thương.
Dữ liệu cường độ được khôi phục dựa trên dữ liệu thương số được lưu trữ và dữ liệu còn lại. Khi dữ liệu dấu và cường độ được khôi phục, bộ chuyển đổi dấu sẽ tái tạo lại giá trị lỗi DPCM. Cuối cùng, đơn vị InvMDPCM song song hoạt động song song với chế độ DPCM dựa trên các giá trị lỗi DPCM gốc và để tái tạo lại dữ liệu pixel.

5 kết quả thực nghiệm
Trong phần này, các kết quả mô phỏng của thuật toán và kiến trúc phần cứng đề xuất được tóm tắt. Hiệu suất sẽ được đo bằng tốc độ nén của thuật toán và băng thông bus trong cấu trúc phần cứng.
5.1 Tỷ số nén
Trong bài báo này, chúng tôi đo tỷ lệ nén (CR) của ảnh nén để kiểm chứng hiệu quả của thuật toán nén không mất dữ liệu. CR đề cập đến kích thước hình ảnh được nén trên kích thước hình ảnh gốc và CR càng cao thì thuật toán nén càng hiệu quả. Phương trình của CR như sau.
CR =Kích thước hình ảnh gốcKích thước hình ảnh nén(3)

Bảy chuỗi hình ảnh thuộc Loại A và B của các điểm chuẩn về mã hóa video hiệu quả cao (HEVC) đã được sử dụng để thu được các phép đo CR trong thuật toán nén không mất dữ liệu và kiến trúc phần cứng được đề xuất.
Thuật toán nén không mất dữ liệu được đề xuất được so sánh với các thuật toán được phát triển trong [4, 5] và [6]. Bảng 1 cho thấy CR trung bình của thuật toán được đề xuất và của [4, 5] và [6] cho tất cả các khung hình của chuỗi hình ảnh HEVC .
Kết quả thử nghiệm đối với chuỗi hình ảnh HEVC cho thấy giá trị CR trung bình lần lượt là 1,99,1,63, 1,92 và 1,91 cho thuật toán nén không mất dữ liệu được đề xuất, [4, 5] và [6].
Thuật toán nén không mất dữ liệu được đề xuất đạt được CR cao hơn trong tất cả các chuỗi hình ảnh HEVC so với các thuật toán khác. Thuật toán MDPCM được đề xuất có yêu cầu chi phí bit 2-để lưu trữ thông tin chế độ DPCM. Như được thể hiện trong các kết quả thử nghiệm của Bảng 1, rõ ràng là tốc độ nén tăng lên của các kết quả hàm dự đoán của thuật toán MDPCM được đề xuất là đủ để đáp ứng yêu cầu trên.

5.2 Phân tích hiệu suất băng thông bus
CR của thuật toán nén được đề xuất có thể bị giới hạn bởi băng thông bus vì dữ liệu được truyền qua bus phải được căn chỉnh theo chiều rộng của nó. Do đó, dữ liệu được truyền qua bus có thể mất CR bằng băng thông của dữ liệu được căn chỉnh.
Để phân tích điều này, chúng tôi đã đo CR trung bình thực tế của bối cảnh giao thông với năm băng thông bus khác nhau là 8, 16, 32, 64 và 128 bit. Hình 4 cho thấy kết quả thử nghiệm của CR thực tế trên chúng.
Ở đây, CR thực tế được giới hạn ở độ rộng bus bit 128-, băng thông phổ biến nhất. Tuy nhiên, CR thực tế trên độ rộng bus bit 8-tương tự như trường hợp lý tưởng của bitone 1-, có nghĩa là hiệu suất của phần cứng nén không mất dữ liệu được đề xuất là tốt trên bit 8- băng thông xe buýt. Do đó, phần cứng nén không mất dữ liệu được đề xuất có thể giảm yêu cầu về băng thông bus.

6 Kết luận
Trong bài báo này, một thuật toán nén không mất dữ liệu và kiến trúc phần cứng được đề xuất để giảm yêu cầu về băng thông bộ nhớ. Kiến trúc phần cứng đề xuất có tốc độ xử lý cao do các bước nén và giải nén có thể thực hiện song song.
Ngoài ra, CR cao còn đạt được bằng cách cải thiện chức năng dự đoán của thuật toán hiện có. Chức năng dự đoán cũng có hiệu suất được cải thiện, phản ánh những ưu điểm của cả DPCM và DDPCM. Chúng tôi đã sử dụng chuỗi hình ảnh HEVC làm điểm chuẩn để xác minh hiệu suất của thuật toán và kiến trúc phần cứng được đề xuất.
Kết quả của thử nghiệm, chúng tôi đã đạt được CR trung bình là 1,99 ở Lớp A và B của chuỗi hình ảnh HEVC. Thông qua đó, kiến trúc nén không mất dữ liệu được đề xuất đã được xác minh để đạt được CR cao hơn các thuật toán so sánh. Ngoài ra, do thuật toán của nghiên cứu này đạt được CR cao, phần cứng nén không mất dữ liệu được đề xuất có thể giảm yêu cầu về băng thông bus.
Do đó, phần cứng nén không mất dữ liệu được đề xuất phù hợp cho các ứng dụng yêu cầu băng thông bộ nhớ và khả năng truy cập bộ nhớ cao, chẳng hạn như GPU và bộ xử lý video có độ phân giải cao.
Lời cảm ơn
Nghiên cứu này được hỗ trợ một phần bởi MOTIE (Bộ Thương mại, Công nghiệp & Năng lượng) (10080568, Phát triển GP-GPU nhúng để nhận dạng hoàn cảnh dựa trên học tập sâu) và chương trình hỗ trợ KSRC (Hiệp hội nghiên cứu bán dẫn Hàn Quốc) để phát triển thiết bị bán dẫn trong tương lai . Công cụ EDA được hỗ trợ bởi Trung tâm Giáo dục ICDesign (IDEC), Hàn Quốc.

Tài liệu tham khảo
[1] D. Burger, JR Goodman, A. Kagi, 'Băng thông hạn chế ảnh hưởng đến thiết kế bộ xử lý', IEEE Micro, tập. 17, không. 6, trang 55–62, tháng 11 năm 1997.
[2] H. David, E. Gorbatov, UR Hanebutte, R. Khanna, C. Le, 'RAPL: ước tính và giới hạn sức mạnh bộ nhớ', Trong Hội nghị chuyên đề quốc tế ACM/IEEE năm 2010 về Thiết kế và Điện tử Công suất Thấp (ISLPED), trang. 189–194, tháng 8 năm 2010.
[3] Hướng dẫn tối ưu hóa ứng dụng OpenGL ES GPU ARM Mali, có sẵn trên.https://developer.arm.com/docs/dui0555/b/optimization-checklist/the-checklist/reduce-memory-bandwidth-usage
[4] H.-S. Kim, J.-H. Lee, H.-J. Kim, S.-H. Kang, W.-C. Park, 'Kiến trúc nén hình ảnh losslessColor sử dụng bộ giải mã phần cứng Golomb-RiceHardware song song', Giao dịch IEEE trên mạch và hệ thống cho công nghệ video, tập. 21, không. 11, trang 1581–1587, tháng 11 năm 2011.
[5] J. Lee, J. Yun, J. Lee, I. Hwang, D. Hong, Y. Kim, CG Kim,W.-C. Park, 'Thuật toán và kiến trúc hiệu quả để nén không mất dữ liệu thông lượng cao đối với hình ảnh có độ phân giải cao', IEEEAccess, Tập. 7, Số 1, trang 138803–138815. Tháng 9 năm 2019.
[6] L. Guo, D. Zhou, S. Goto, 'Thuật toán nén lại khung tham chiếu mới và kiến trúc VLSI của nó cho codec video UHD TV', IEEETransactions on Multimedia, vol. 16, trang 2323–2332, tháng 12 năm 2014.
[7] AD Mitra, PK Srimani, 'Điều chế mã xung vi sai', Int. J.Electron., tập. 46, trang 633–637, tháng 6 năm 1972.
[8] S. Morein, 'Siêu công nghệ ATI Radeon', Trong Kỷ yếu phần cứng đồ họa, 2000.
[9] D. Silveira, G. Povala, L. Amaral, B. Zatt, L. Agostini, M. Proto,'Lược đồ nén khung tham chiếu hiệu quả cho hệ thống mã hóa video:thuật toán và thiết kế VLSI', Tạp chí Hình ảnh Thời gian thực Đang xử lý 16, trang. 391–411, 2019.
[10] Yu-Hsuan Lee, Tzu-Chieh Chen, Hsuan-Chi Liang, Jian-Xiang Liao, 'Thuật toán và thiết kế kiến trúc của Công cụ phát hiện góc hình ảnh FAST-C', Hệ thống tích hợp quy mô rất lớn (VLSI) Giao dịch IEEE, tập. 29, không. 4, trang 788–799, 2021.
[11] Sungchul Yoon, Sungho Jun, Yongkwon Cho, Kilwhan Lee, HyukjaeJang, Tae Hee Han, 'Nén nhúng không mất dữ liệu được tối ưu hóa cho các ứng dụng đa phương tiện di động', Điện tử, tập. 9, tr. 868, năm 2020.
[12] Yu-Hsuan Lee, Cheng-Hung Kuei, Yue-Zhan Kao, Shih-Song Fan Jiang,'Thuật toán và thiết kế kiến trúc VLSI của bộ mã hóa nén nhúng không tổn hao cho hệ thống mã hóa video HD', Tạp chí mạch, hệ thống và máy tính , 2020.
For more information:1950477648nn@gmail.com






