Phân tích tình cảm dựa trên trí nhớ ngắn hạn dài hạn hiệu quả của các bài đánh giá thương mại điện tử Phần 2
Jan 18, 2024
Muhammad và cộng sự. [20] đã trình bày một mô hình phân tích tình cảm bằng cách sử dụng word2vec và LSTM để đánh giá khách sạn.
Muhammad là nhà tiên tri và người sáng lập đạo Hồi. Ông nổi tiếng là người thông minh, thông thái và thông minh. Trí nhớ của anh ấy rất mạnh mẽ, điều này giúp anh ấy xử lý thông tin và bày tỏ suy nghĩ của mình rất hiệu quả.
Trí nhớ của Muhammad liên quan nhiều đến trình độ học vấn và kinh nghiệm của ông. Theo ghi chép, thời trẻ ông thường đắm chìm trong suy nghĩ và suy ngẫm. Sự tò mò và khao khát kiến thức này đã giúp anh xây dựng nền tảng kiến thức và khả năng ghi nhớ vững chắc.
Ngoài ra, trí thông minh của Muhammad cũng đóng vai trò lớn trong khả năng ghi nhớ của ông. Anh ấy thông minh, hóm hỉnh, sâu sắc và có khả năng tư duy logic, rất thuận lợi khi xử lý những thông tin phức tạp. Ưu điểm này giúp anh quản lý và kiểm soát quá trình ghi nhớ tốt hơn, từ đó cải thiện trí nhớ của mình.
Tuy nhiên, trí nhớ của Muhammad không phải bẩm sinh mà được cải thiện nhờ chăm chỉ và luyện tập. Bé thường xuyên rèn luyện trí nhớ như đọc đi đọc lại, đọc chính tả và nói nhiều lần để giúp bé hiểu và nắm vững kiến thức sâu sắc hơn.
Trí nhớ của Muhammad không chỉ là tài năng bẩm sinh mà nó còn được cải thiện nhờ sự chăm chỉ và luyện tập. Điều này cho thấy mỗi chúng ta đều có thể cải thiện trí nhớ và nâng cao hiệu quả học tập, làm việc thông qua học tập và thực hành. Chúng ta, giống như Muhammad, hãy tích cực làm việc chăm chỉ để không ngừng nâng cao kỹ năng ghi nhớ của mình, nhằm đạt được thành công lớn hơn trong cuộc sống và công việc! Có thể thấy rằng chúng ta cần cải thiện trí nhớ và Cistanche Deserticola có thể cải thiện đáng kể trí nhớ, bởi vì Cistanche Deserticola cũng có thể điều chỉnh sự cân bằng của các chất dẫn truyền thần kinh, chẳng hạn như tăng mức độ acetylcholine và các yếu tố tăng trưởng. Những chất này rất quan trọng cho trí nhớ và học tập. Ngoài ra, Thịt còn có thể cải thiện lưu lượng máu và thúc đẩy quá trình cung cấp oxy, có thể đảm bảo não nhận đủ chất dinh dưỡng và năng lượng, từ đó cải thiện sức sống và sức bền của não.

Bấm Biết để cải thiện trí nhớ ngắn hạn
Đối với nghiên cứu này, dữ liệu được thu thập bằng cách thu thập dữ liệu trang web du lịch bằng cách sử dụng selen và mẩu tin lưu niệm. +e Mục đích quan trọng nhất của thí nghiệm này là phân tích độ chính xác bằng cách thay đổi các tham số của word2vec và LSTM. + Kết quả e cho thấy độ chính xác trung bình là 85,96 có thể đạt được bằng cách sử dụng các tham số, cho kết quả đầy hứa hẹn.
Zhao và cộng sự. [21] đã giới thiệu một kỹ thuật mới để phân tích cảm xúc của khách hàng từ các đánh giá trên các trang web thương mại điện tử. +e kỹ thuật tối ưu hóa được đề xuất "Mạng thần kinh Elman dựa trên thuật toán tìm kiếm địa phương (LSIBA-ENN)" bao gồm bốn bước và phát hiện sự phân cực cũng như phân loại cảm xúc của các bài đánh giá. + Dữ liệu điện tử cho nghiên cứu này được thu thập bằng cách sử dụng công cụ loại bỏ web trên các trang web thương mại điện tử để trích xuất các đánh giá của khách hàng.
Ngoài việc xử lý trước dữ liệu, nghiên cứu này còn sử dụng "Tần số lớp nghịch đảo được sửa đổi dựa trên tần số LogTerm (LTF-MICF) và Thuật toán ấm trái đất dựa trên đột biến lai (HMEWA)" để tính trọng số thuật ngữ và lựa chọn tính năng. +e phương pháp đề xuất vượt trội hơn các kỹ thuật cơ bản khác về độ chính xác dự đoán.
Jiang [22] đã đề xuất một mô hình để phân loại cảm xúc của các bài đánh giá thu được từ nền tảng thương mại điện tử Taobao.+Nghiên cứu điện tử sử dụng thuật toán học máy cũng như máy vectơ hỗ trợ để phân loại và cải thiện tối ưu hóa nhóm hạt (IPSO) để tối ưu hóa các tham số. +dữ liệu cho nghiên cứu được thu thập bằng cách thu thập thông tin các nhận xét từ trang web. +e Kết quả thực nghiệm chứng minh phương pháp kết hợp SVM và IPSO có độ chính xác cao hơn. Tuy nhiên, phần lớn các mô hình hiện tại gặp phải tình trạng trang bị quá mức [23–25], tốc độ hội tụ kém [26–28] và các vấn đề biến mất độ dốc [29–31].
3. Nghiên cứu thực nghiệm
Phần +is cung cấp một cái nhìn tổng quan rõ ràng về phương pháp được sử dụng trong dự án để phân loại cảm xúc. +e kỹ thuật đã được sử dụng là mạng Bộ nhớ ngắn hạn dài, được sử dụng để phân loại một số lượng lớn các đánh giá về cơ sở dữ liệu Amazon. +e nhúng được sử dụng là word2vec, đã được đào tạo tùy chỉnh theo cơ sở dữ liệu.
Điều chỉnh word2vec theo tập dữ liệu sẽ cải thiện hiệu suất tổng thể của mô hình. +Lợi ích của việc sử dụng LSTM là nó mang lại kết quả tốt hơn ngay cả đối với dữ liệu đánh giá phi cấu trúc. Nó có khả năng thu được chức năng hữu ích cho các tài nguyên chứa sự phụ thuộc lâu dài.
+e dữ liệu được thu thập từ tập dữ liệu đánh giá của Amazon, sau đó được xử lý trước. Việc nhúng Word2vec tạo thành một bước quan trọng trong quá trình tiền xử lý dữ liệu. Dữ liệu đào tạo và kiểm tra đã được tạo. +e dữ liệu huấn luyện được chia thành các tập dữ liệu huấn luyện và xác nhận. +e mô hình word2vec tùy chỉnh được đào tạo cho cơ sở dữ liệu. +e thu được vectơ đặc trưng, sau đó được sử dụng làm lớp nhúng cho mô hình LSTM.
Keras được sử dụng để xây dựng mô hình tuần tự LSTM với các tính năng tối đa bằng 50,000 và kích thước nhúng bằng 16. +emodel sau đó được đào tạo trong 10 kỷ nguyên. +e mô hình được kiểm tra dựa trên số liệu hiệu suất sklearn. + Quá trình thu được các tính năng được mô tả trong Hình 2.
3.1. Tập dữ liệu. Để tạo ra kết quả chính xác, tập dữ liệu được sử dụng phải lớn và phong phú. +e tập dữ liệu đã được thu thập từ phần điện thoại di động và phụ kiện trực tuyến của tập dữ liệu Đánh giá của Amazon (2018). Tập dữ liệu +e bao gồm tổng cộng 938.261 đánh giá, trong đó 47901 là các sản phẩm độc đáo và 153124 là các đánh giá duy nhất của người dùng. +e tập dữ liệu ban đầu bao gồm 7 cột, cụ thể là xếp hạng thay đổi từ 1 đến 5, thời gian đánh giá, ID người đánh giá, ID sản phẩm và tóm tắt văn bản đánh giá.
Sau khi loại bỏ các bản sao, tập dữ liệu bao gồm 938254 bản ghi và Bảng 2 hiển thị một đoạn của các bản ghi tập dữ liệu gốc.
3.2. Phương pháp luận. Chúng tôi đã đào tạo tùy chỉnh mô hình word2vec của mình để sử dụng với mô hình LSTM để phân loại. Word2vec là một cách nhúng từ được sử dụng để biểu thị một từ bằng một tập hợp nhiều thuật ngữ của vectơ. Nó không còn là việc ánh xạ một từ vào một không gian vectơ. +e tập dữ liệu được tải vào khung dữ liệu gấu trúc. Để phát triển mô hình customword2vec, bước đầu tiên là tiền xử lý dữ liệu.
Chúng tôi chỉ nhìn vào văn bản xếp hạng và đánh giá và bỏ mọi thứ khác. +e văn bản được làm sạch bằng cách loại bỏ dấu câu. Một mẫu văn bản phụ được tạo từ gần 200,000 bài đánh giá và phương pháp văn bản rõ ràng được áp dụng để chuyển đổi mọi bài đánh giá thành danh sách các từ. +là danh sách các từ hiện đóng vai trò là đầu vào cho mô hình genism word2vec.
Chúng tôi đã xây dựng mô hình Skip-gram word2vecmodel được đào tạo tùy chỉnh và khởi tạo mô hình với các thứ nguyên: kích thước của vectơ từ là 100, kích thước cửa sổ bằng 15, min_đếm là 2 cho các từ xuất hiện ít hơn 2 lần trong kho văn bản của chúng tôi, âm bằng 5 và tốc độ lấy mẫu bằng 1e−5. Chúng tôi đã sử dụng tất cả các khía cạnh này để xây dựng vốn từ vựng cho các câu ôn tập của mình.

Chúng tôi đào tạo mô hình word2vec của mình cho 1000 kỷ nguyên. +vi chúng tôi tính toán tổn thất ở mỗi thời điểm. +e tổn thất cao ở thời điểm đầu và giảm dần về thời điểm cuối cùng. +e mất mát ở kỷ nguyên 0 là 2239394.0 và mất mát ở kỷ nguyên 1000 là 11504.0.+e mô hình đã lưu sau đó được tải lại và các hoạt động được thực hiện trên đó.
Ví dụ: nếu chúng tôi muốn tìm các từ tương tự như tiếng ồn trong tập dữ liệu của mình, chúng tôi sẽ nhận được hủy vàtai nghe.
Tương tự, chúng ta cũng có thể tìm thấy độ tương tự giữa một số từ nhất định như tai nghe và tai nghe là {{0}}.48756 và độ tương tự giữa các từsạc và bộ sạc là 0,89264.
Để giảm kích thước dữ liệu của chúng tôi, chúng tôi đã sử dụng trực quanTSNE để vẽ dữ liệu thành hai chiều. Giờ đây, các vectơ từ này có thể được sử dụng để phân loại thêm. Sau đó, các phần nhúng +ese được sử dụng làm tính năng để phát trực tuyến thêm.
3.2.1. Chuẩn bị dữ liệu cho LSTM. Tập dữ liệu của chúng tôi bao gồm 938254 bản ghi với hầu hết các bài đánh giá có phân bổ điểm lớn hơn 3. Trước tiên, chúng tôi đã tính số từ cho mỗi bài đánh giá. +e giá trị trung bình trung bình được sử dụng làm số liệu thống kê để tìm độ dài trung bình của các bài đánh giá. +e độ dài trung bình của bài đánh giá là 44,59 và độ dài tối đa là 4303.
Chúng tôi đã tạo một tập dữ liệu bao gồm các bài đánh giá có từ 100 từ trở xuống. Các bài đánh giá có độ dài trên 20 nhưng nhỏ hơn 100 được phân loại thành các bài đánh giá ngắn và các bài đánh giá còn lại được phân loại theo các bài đánh giá dài. +e số lượng đánh giá ngắn là 411313 và đánh giá dài là 100239. Các siêu tham số được sử dụng trong mô hình được mô tả trong Bảng 3.
Tiếp theo, chúng tôi đã xác định xếp hạng cảm tính là tích cực nếu xếp hạng lớn hơn hoặc bằng 3; nếu không, đánh giá là tiêu cực. Chúng tôi đã xem xét văn bản đánh giá và ý kiến để tạo tập dữ liệu tàu. +dữ liệu thử nghiệm bao gồm các sản phẩm có ít nhất hơn 10 đánh giá.
Sau khi phân phối, tập dữ liệu huấn luyện bao gồm tổng cộng 203891 bản ghi, trong đó 175910 thuộc về lớp dương và 27981 thuộc về lớp âm. + Tập dữ liệu thử nghiệm e bao gồm tổng cộng 686345 bản ghi, trong đó 592118 thuộc loại dương và 94227 thuộc loại âm.
Trong nghiên cứu này, chúng tôi đã sử dụng Keras để xây dựng mô hình LSTM, mô hình này có tối đa 50,{1}} tính năng làm đầu vào cho lớp nhúng. Bộ nhớ ngắn hạn dài (LSTM) là một loại mạng thần kinh tái phát sử dụng cơ chế bên trong để điều chỉnh luồng thông tin.+là cơ chế bên trong bao gồm các cổng cần được đào tạo để có thể lọc chính xác thông tin không liên quan và giữ lại thông tin hữu ích.

Hình 3 cho thấy kiến trúc cơ bản của mô hình LSTM trong phương pháp đề xuất của chúng tôi.
Ht−1 và Xt là đầu vào của đơn vị LSTM;Ht−1, thường được gọi là bộ nhớ ngắn hạn, lấy đầu ra từ các trạng thái trước đó làm đầu vào. +e ô nhớ hoặc bộ nhớ dài hạn, Ct −1, giúp mang thông tin liên quan trong suốt quá trình của một chuỗi. + Kiến trúc eLSTM kết hợp 3 cổng: cổng quên, cổng vào và cổng ra. Trong đơn vị LSTM, các hàm tanh và sigmoid được sử dụng để thu được các cổng này.
+e dữ liệu tàu sau đó được chia thành dữ liệu đào tạo và xác thực có độ dài bằng nhau. +e độ dài của dữ liệu được tính là 101945 và phân bổ lớp là {1: 87955, 0:13990}. Để tạo tập dữ liệu xác thực và kiểm tra tàu TensorFlow, chúng tôi cần chuyển đổi dữ liệu tàu thành chuỗi. Chúng tôi đã đệm chúng đến độ dài tối đa là 100 để tất cả các chuỗi đều có cùng độ dài. +e nhãn đào tạo và kiểm tra

For more information:1950477648nn@gmail.com






