Ứng dụng hàng đợi và các kỹ thuật xử lý ngôn ngữ tự nhiên để xây dựng công cụ trích xuất và tóm tắt nội dung trang web

1. Introduction

Đây là một đồ án môn học thuộc học phần Cấu trúc dữ liệu giải thuật của đại học kinh tế UEH.
Dự án được lập trình chính bằng ngôn ngữ Javascript và Java, với các công nghệ được trình bày như hình vẽ.

Dự án mong muốn tạo ra một ứng dụng web với các chức năng:

Cào dữ liệu HTML từ một trang web hoặc đọc HTML từ một file.
Sử dụng hàng đợi để lọc các đoạn nội dung (content).
Tóm tắt nội dung bằng chatbot.

2. Application setup

Để thiết lập dự án, thực hiện các bước sau:

2.1. Cài đặt các công cụ cần thiết

Cài đặt npm
Xem chi tiết tại npm documentation.
Cài đặt Maven management (mvn)
Xem chi tiết tại Maven documentation.
Thiết lập MongoDB Atlas
Xem chi tiết tại MongoDB Atlas documentation.

Cài đặt biến môi trường

set OPENAI_KEY=<YOUR OPENAI KEY>
set DATABASE_NAME=<YOUR Mongodb DB name>
set DATABASE_URI=<YOUR DB URI>

2.2. Sao chép và thiết lập dự án

Clone dự án từ GitHub:

git clone [<project-repo-link> # Thay <project-repo-link> bằng liên kết dự án của bạn](https://github.com/dinhtanloc/Scrawler-Web-data-using-DSA-Algorithm.git)

Tại thư mục chính của dự án, sử dụng terminal để thiết lập các thư mục con:

Frontend

cd frontend
npm i
npm run dev

Frontend sẽ được chạy ở cổng 3000.

Backend

cd backend
mvn clean install
mvn spring-boot:run

Backend sẽ được chạy ở cổng 8080.

Database

COLLECTION_NAME: chunks

Ghi chú

Cần đảm bảo các biến môi trường được thiết lập chính xác.
Hãy kiểm tra tài liệu hướng dẫn chi tiết trong các liên kết bên trên nếu gặp vấn đề.

3. Báo cáo đồ án và kết thúc môn

Đây là báo cáo đồ án chi tiết Docs
Link video demo ở đây: Video Demo

Name		Name	Last commit message	Last commit date
Latest commit History 103 Commits
.idea		.idea
backend		backend
frontend		frontend
images		images
target		target
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Ứng dụng hàng đợi và các kỹ thuật xử lý ngôn ngữ tự nhiên để xây dựng công cụ trích xuất và tóm tắt nội dung trang web

1. Introduction

2. Application setup

2.1. Cài đặt các công cụ cần thiết

2.2. Sao chép và thiết lập dự án

Frontend

Backend

Database

Ghi chú

3. Báo cáo đồ án và kết thúc môn

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Ứng dụng hàng đợi và các kỹ thuật xử lý ngôn ngữ tự nhiên để xây dựng công cụ trích xuất và tóm tắt nội dung trang web

1. Introduction

2. Application setup

2.1. Cài đặt các công cụ cần thiết

2.2. Sao chép và thiết lập dự án

Frontend

Backend

Database

Ghi chú

3. Báo cáo đồ án và kết thúc môn

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages