Trang này được dịch bởi Cloud Translation API.

Thực hành với Gemini CLI

1. Giới thiệu

Trong lớp học lập trình này, bạn sẽ tìm hiểu về Gemini CLI, một tác nhân AI nguồn mở mang sức mạnh của Gemini trực tiếp vào thiết bị đầu cuối của bạn.

Dự án Gemini CLI là dự án nguồn mở và bạn có thể xem lộ trình công khai tại đây.

Trong lớp học lập trình này, bạn sẽ sử dụng phương pháp từng bước trong các hoạt động như:

Cài đặt Gemini CLI
Cấu hình cơ bản
Khám phá các công cụ và lệnh tích hợp trong Gemini CLI
Tuỳ chỉnh Gemini CLI thông qua tệp GEMINI.md
Khám phá một số trường hợp sử dụng với Gemini CLI

Bạn cần có

Trình duyệt web Chrome
Tài khoản Gmail
Một máy cục bộ đã cài đặt Node 20+.

Lớp học lập trình này được thiết kế cho người dùng và nhà phát triển ở mọi cấp độ (kể cả người mới bắt đầu).

2. Cài đặt

Trước khi thiết lập và chạy Gemini CLI, hãy tạo một thư mục mà chúng ta sẽ dùng làm thư mục chính cho tất cả các dự án mà chúng ta có thể tạo bên trong thư mục đó. Đây là điểm bắt đầu để Gemini CLI hoạt động, mặc dù công cụ này cũng sẽ tham chiếu một số thư mục khác trên hệ thống của bạn và chúng ta sẽ đề cập đến các thư mục này sau, nếu cần.

Tiếp tục tạo một thư mục mẫu (gemini-cli-projects) rồi chuyển đến thư mục đó thông qua các lệnh bên dưới. Nếu bạn muốn sử dụng tên thư mục khác, vui lòng thực hiện.

mkdir gemini-cli-projects

Hãy chuyển đến thư mục đó:

cd gemini-cli-projects

Để chạy Gemini CLI, bạn có thể sử dụng một trong các phương thức sau:

Chạy lệnh sau:

npx https://github.com/google-gemini/gemini-cli

Trước tiên, bạn có thể cài đặt Gemini CLI trên toàn hệ thống. Đảm bảo bạn có quyền Quản trị viên để thực hiện việc đó.

npm install -g @google/gemini-cli

rồi chạy lệnh sau:

gemini

Giả sử bạn đã chạy Gemini CLI bằng một trong các phương thức nêu trên, bạn sẽ thấy màn hình sau đây yêu cầu bạn chọn một giao diện. Hãy tiếp tục và chọn một kiểu mà bạn thích:

Sau khi bạn chọn, hệ thống sẽ yêu cầu bạn chọn Phương thức xác thực. Bạn nên sử dụng Tài khoản Google cá nhân thay vì tài khoản không phải của Google hoặc tài khoản liên quan đến Google Workspace trong phòng thí nghiệm này. Giấy phép miễn phí này cho phép bạn sử dụng Gemini 2.5 Pro và cửa sổ ngữ cảnh 1 triệu token của mô hình này. Cấp miễn phí cho phép gửi 60 yêu cầu về mô hình mỗi phút và 1.000 yêu cầu mỗi ngày mà không tốn phí.

Nếu hạn mức miễn phí hiện tại được cấp cho Tài khoản Google không đủ, bạn có thể chọn sử dụng Khoá Gemini API hoặc thậm chí là Google Cloud Vertex AI. Trong trường hợp này, bạn sẽ cần có mã dự án và tên vị trí cho dự án đó. Hãy tham khảo phần Xác thực trong tài liệu nếu bạn dự định sử dụng các phương thức xác thực khác.

Hãy nhấp vào Enter. Thao tác này sẽ mở trang Xác thực của Google trong trình duyệt. Tiến hành xác thực bằng Tài khoản Google của bạn, chấp nhận các điều khoản và sau khi xác thực thành công, bạn sẽ thấy Gemini CLI đã sẵn sàng và đang chờ lệnh của bạn. Dưới đây là ảnh chụp màn hình mẫu:

Nhập /help (dấu gạch chéo xuôi) và bạn sẽ thấy nhiều lệnh cũng như phím tắt như minh hoạ dưới đây:

Lần đầu tiên tương tác với Gemini CLI

Nhập tin nhắn đầu tiên của bạn vào hộp. Chúng ta sẽ đưa ra một truy vấn như:

Bạn sẽ nhận thấy rằng truy vấn của chúng ta đã tạo ra một công cụ GoogleSearch (một công cụ tích hợp trong Gemini CLI) được gọi. Đây là một cách thú vị mà chúng tôi đã sử dụng một trong những công cụ mạnh mẽ được tích hợp sẵn của Gemini CLI, cụ thể là GoogleSearch. Công cụ này đưa ra câu trả lời dựa trên thông tin mà nó lấy được từ web. Chúng ta sẽ tìm hiểu thêm về Công cụ trong phần tiếp theo.

Tạm thời, hãy thoát Gemini CLI. Bạn có thể thực hiện việc này thông qua lệnh /quit hoặc thực hiện lệnh Ctrl-C hai lần trong phiên tương tác của Gemini CLI.

Tệp tuỳ chỉnh Gemini CLI : settings.json

Nếu nhớ lại lần đầu tiên chúng ta bắt đầu sử dụng Gemini CLI, bạn sẽ thấy chúng ta được yêu cầu chọn một chủ đề rồi chọn một phương thức xác thực. Trong các lần chạy Gemini CLI tiếp theo, bạn sẽ không được yêu cầu chọn lại một giao diện và phương thức xác thực. Điều này có nghĩa là tệp này được duy trì ở một nơi nào đó và tệp mà tệp này sử dụng có tên là settings.json. Đây là cách để tuỳ chỉnh Gemini CLI.

Các chế độ cài đặt được áp dụng theo thứ tự ưu tiên sau:

Không gian làm việc: .gemini/settings.json (ghi đè chế độ cài đặt người dùng và hệ thống).
Người dùng: ~/.gemini/settings.json (ghi đè chế độ cài đặt hệ thống).
Hệ thống: /etc/gemini-cli/settings.json (áp dụng cho tất cả người dùng).

Nếu bạn nhớ, tại thời điểm chọn giao diện, chúng tôi đã yêu cầu bạn lưu chế độ cài đặt trong phần Cài đặt người dùng. Vì vậy, hãy truy cập vào ~/.gemini folder và bạn sẽ thấy tệp settings.json.

Tệp settings.json của tôi được minh hoạ bên dưới. Nếu đã chọn một giao diện khác, bạn sẽ thấy tên của giao diện đó ở đó.

{
  "theme": "Default",
  "selectedAuthType": "oauth-personal"
}

3. Tham số lệnh Gemini CLI

Có một số tham số dòng lệnh mà bạn có thể cung cấp khi khởi động Gemini CLI. Để xem danh sách đầy đủ các lựa chọn, bạn có thể sử dụng --help như minh hoạ dưới đây.

gemini --help

Thao tác này sẽ cho thấy toàn bộ các lựa chọn có sẵn. Bạn nên xem tài liệu tại đây.

Hãy cùng tìm hiểu một số ví dụ. Cách đầu tiên là định cấu hình Gemini CLI để sử dụng mô hình Pro hoặc Flash. Hiện tại, tại thời điểm viết hướng dẫn này, đây là 2 mô hình duy nhất được hỗ trợ. Theo mặc định, mô hình Gemini 2.5 Pro sẽ được dùng. Tuy nhiên, nếu muốn dùng Mô hình Flash, bạn có thể thực hiện việc này khi khởi động Gemini CLI thông qua tham số -m như minh hoạ dưới đây:

gemini -m "gemini-2.5-flash"

Bạn sẽ nhận thấy rằng nếu bắt đầu theo cách trên, bạn có thể kiểm tra mô hình ở dưới cùng bên phải của thiết bị đầu cuối Gemini CLI như minh hoạ dưới đây:

Chế độ không tương tác

Một lựa chọn thú vị là chạy Gemini CLI ở chế độ không tương tác. Điều này có nghĩa là bạn cung cấp trực tiếp câu lệnh cho Gemini và Gemini sẽ tiếp tục phản hồi câu lệnh đó mà không cần mở thiết bị đầu cuối tương tác Gemini CLI. Điều này rất hữu ích nếu bạn dự định sử dụng Gemini CLI theo cách tự động trong tập lệnh hoặc bất kỳ quy trình tự động hoá nào khác. Bạn dùng tham số -p để cung cấp câu lệnh cho Gemini CLI như minh hoạ bên dưới:

gemini -p "What is the gcloud command to deploy to Cloud Run"

Xin lưu ý rằng bạn không thể tiếp tục trò chuyện bằng cách đặt câu hỏi nối tiếp.

4. Gemini CLI – Các công cụ tích hợp

Gemini CLI đi kèm với một bộ công cụ tích hợp và tài liệu về công cụ nêu rõ "Mô hình Gemini sử dụng các công cụ này để tương tác với môi trường cục bộ của bạn, truy cập thông tin và thực hiện các hành động. Những công cụ này giúp tăng cường các chức năng của CLI, cho phép công cụ này không chỉ tạo văn bản mà còn hỗ trợ nhiều nhiệm vụ."

Để lấy danh sách các Công cụ tích hợp hiện tại, chúng ta chỉ cần gọi lệnh /tools như minh hoạ bên dưới:

Một trong những điều bạn cần lưu ý ngay lập tức là tự hỏi liệu Gemini CLI có thể gọi những công cụ này một cách đơn giản khi muốn hay không? Câu trả lời mặc định là không, khi nói đến các thao tác nhạy cảm có thể liên quan đến việc ghi vào hệ thống cục bộ, đọc từ hệ thống bên ngoài, truy cập vào mạng bên ngoài, v.v.

Mặc dù có một --yolomode khi bạn khởi động CLI (giao diện dòng lệnh) mà chúng tôi sẽ không sử dụng, nhưng bạn sẽ thấy Gemini CLI nhắc bạn cấp quyền chạy công cụ mà công cụ này đã chọn. Bạn có thể từ chối cấp quyền, hoặc cho phép chạy một lần hoặc cấp quyền chung để luôn chạy. Bạn đang và nên nắm toàn quyền kiểm soát mọi việc.

Hãy đưa ra một câu lệnh để Gemini CLI chọn một trong các công cụ tích hợp để thực thi. Câu lệnh này sẽ giúp chúng ta hiểu rõ cách hoạt động của công cụ.

Chúng tôi muốn lấy thông tin về tin tức tài chính mới nhất trên toàn thế giới và lưu thông tin đó vào một tệp trong thư mục làm việc cục bộ nơi chúng tôi chạy Gemini CLI. Chúng tôi đưa ra câu lệnh sau:

Search for the latest headlines today in the world of finance and save them in a file named finance-news-today.txt

Hãy tưởng tượng xem nó cần làm gì. Lý tưởng nhất là nó cần truy cập Google Tìm kiếm để lấy tin tức từ một số nguồn thông tin có liên quan có thể cung cấp tin tức tài chính. Sau đó, bạn cần tạo một tệp có tên là finance-news-today.txt (một thao tác ghi trên hệ thống cục bộ sẽ yêu cầu bạn cấp quyền) cùng với nội dung của tệp.

Hãy xem điều gì sẽ xảy ra (bạn nên tiếp tục thực hiện tương tự trên máy của mình).

Điều đầu tiên mà công cụ này làm là gọi công cụ GoogleSearch để tìm kiếm trên web.

Sau khi tìm kiếm xong, phương thức này sẽ truy xuất dữ liệu như minh hoạ dưới đây:

Sau khi hoàn tất, bạn có thể ghi nội dung này vào tệp và nội dung sẽ sử dụng công cụ WriteFile. Tuy nhiên, vì đây là một thao tác nhạy cảm (ghi), nên nội dung sẽ yêu cầu bạn cấp quyền. Bạn có thể quyết định loại quyền, tức là cho phép một lần, luôn cho phép, v.v. Hiện tại, chúng ta sẽ chọn cho phép một lần.

Sau đó, thông tin này sẽ được ghi vào tệp và một thông báo thành công sẽ xuất hiện bên dưới:

Làm cách nào để kiểm tra xem tệp có được ghi hay không? Chúng ta có thể dùng @file để yêu cầu đọc nội dung. Chúng tôi đưa ra một câu lệnh như minh hoạ bên dưới. Khi chúng ta nhập @, danh sách các tệp trong thư mục hiện tại sẽ xuất hiện và tệp vừa tạo cũng xuất hiện. Chọn câu lệnh đó rồi gửi. Câu lệnh của tôi được trình bày dưới đây:

read the contents of @finance-news-today.txt

Thao tác này sẽ dẫn đến việc các công cụ bắt buộc (ReadManyFiles, ReadFile) được gọi và nội dung sẽ xuất hiện như minh hoạ dưới đây:

Đây cũng là thời điểm thích hợp để tìm hiểu cách làm việc trực tiếp với Shell trong Gemini CLI. Bạn có thể chuyển sang chế độ shell bằng cách nhấn ! trong hộp tin nhắn. Thao tác này sẽ chuyển sang chế độ Shell. Bạn có thể quay lại bằng cách nhấn lại phím ! hoặc nhấn phím ESC.

Khi ở chế độ shell, bạn sẽ thấy biểu tượng ! ở đầu lời nhắc như minh hoạ dưới đây:

Tôi có thể kiểm tra trực tiếp bằng các lệnh tiêu chuẩn như pwd và ls như minh hoạ dưới đây:

Hôm nay, chúng ta có thể in nội dung của tệp thông qua lệnh cat.

Bài tập: Sau đây là một bài tập ngắn để bạn thử. Chọn một nguồn cấp dữ liệu RSS mà bạn muốn. Đưa ra câu lệnh cho Gemini CLI để tìm nạp nội dung của nguồn cấp dữ liệu RSS và định dạng kết quả theo một cách cụ thể cho bạn. Đây là một cách hay để tự động hoá một việc nào đó vào đầu ngày.

Gợi ý: Bạn nên để Gemini CLI sử dụng công cụ WebFetch.

5. Định cấu hình máy chủ Giao thức ngữ cảnh mô hình (MCP)

Máy chủ MCP là một ứng dụng cung cấp các công cụ và tài nguyên cho Gemini CLI thông qua Giao thức ngữ cảnh mô hình, cho phép Gemini CLI tương tác với các hệ thống và nguồn dữ liệu bên ngoài. Các máy chủ MCP đóng vai trò là cầu nối giữa mô hình Gemini và môi trường cục bộ của bạn hoặc các dịch vụ khác như API.

Máy chủ MCP cho phép Gemini CLI khám phá và thực thi các công cụ, từ đó mở rộng khả năng của Gemini CLI để thực hiện các hành động ngoài các tính năng tích hợp sẵn, chẳng hạn như tương tác với cơ sở dữ liệu, API, tập lệnh tuỳ chỉnh hoặc quy trình làm việc chuyên biệt.

Gemini CLI hỗ trợ việc định cấu hình các máy chủ MCP để khám phá và sử dụng các công cụ tuỳ chỉnh. Nếu đã chạy Gemini CLI, bạn có thể kiểm tra các máy chủ MCP được định cấu hình thông qua lệnh /mcp như minh hoạ dưới đây:

Nếu bạn chưa định cấu hình bất kỳ máy chủ MCP nào, thì ứng dụng này sẽ khởi chạy tài liệu về Máy chủ MCP của Gemini CLI.

Bạn có thể định cấu hình các máy chủ MCP ở cấp độ chung trong tệp ~/.gemini/settings.json hoặc trong thư mục gốc của dự án. Tạo hoặc mở tệp .gemini/settings.json. Trong tệp này, bạn sẽ cần thêm khối cấu hình mcpServers, như minh hoạ dưới đây:

"mcpServers": {
    "server_name_1": {},
    "server_name_2": {},
    "server_name_n": {}
 }

Mỗi cấu hình máy chủ đều hỗ trợ các thuộc tính sau ( Tài liệu tham khảo):

Bắt buộc (một trong những giá trị sau)

command (string): Đường dẫn đến tệp thực thi cho phương thức truyền Stdio
url (chuỗi): URL điểm cuối SSE (ví dụ: "http://localhost:8080/sse")
httpUrl (chuỗi): URL điểm cuối phát trực tuyến qua HTTP

Không bắt buộc

args (string[]): Đối số dòng lệnh cho phương thức truyền Stdio
headers (object): Tiêu đề HTTP tuỳ chỉnh khi sử dụng url hoặc httpUrl
env (đối tượng): Biến môi trường cho quy trình máy chủ. Các giá trị có thể tham chiếu đến các biến môi trường bằng cách sử dụng cú pháp $VAR_NAME hoặc ${VAR_NAME}
cwd (chuỗi): Thư mục làm việc cho phương thức truyền Stdio
timeout (number): Thời gian chờ yêu cầu tính bằng mili giây (mặc định: 600.000 mili giây = 10 phút)
trust (boolean): Khi có giá trị true, tham số này sẽ bỏ qua tất cả các bước xác nhận lệnh gọi công cụ cho máy chủ này (mặc định: false)
includeTools (string[]): Danh sách tên công cụ cần đưa vào từ máy chủ MCP này. Khi được chỉ định, chỉ những công cụ có trong danh sách này mới có sẵn trên máy chủ này (hành vi danh sách cho phép). Nếu bạn không chỉ định, thì theo mặc định, tất cả các công cụ trên máy chủ sẽ được bật.
excludeTools (string[]): Danh sách tên công cụ cần loại trừ khỏi máy chủ MCP này. Các công cụ có trong danh sách này sẽ không có sẵn cho mô hình, ngay cả khi máy chủ hiển thị các công cụ đó. Lưu ý: excludeTools sẽ được ưu tiên hơn includeTools – nếu một công cụ có trong cả hai danh sách, thì công cụ đó sẽ bị loại trừ.

Hãy tiến hành định cấu hình một trong những máy chủ MCP chính mà bạn có thể cần nếu đang làm việc với Github. Mặc dù bạn nên lưu ý rằng Gemini CLI sẽ gọi các công cụ git mà bạn có trên hệ thống của mình và bạn cũng có thể hướng dẫn Gemini CLI sử dụng công cụ đó. Vì vậy, hãy hiểu rằng công cụ này sẽ giúp bạn thực hiện các lệnh và thực thi lệnh đó cho bạn, nhưng bạn phải thiết lập các công cụ đó trên hệ thống của mình.

Máy chủ Github MCP

Máy chủ MCP chính thức của Github cung cấp đủ tài liệu về các công cụ mà máy chủ này hiển thị cùng với cách định cấu hình các công cụ đó. Bạn có thể chọn chạy cục bộ hoặc từ xa, vì Gemini CLI cũng hỗ trợ các máy chủ MCP từ xa.

Trong hướng dẫn này, chúng ta sẽ chọn sử dụng tuỳ chọn Remote MCP Server trong Github. Để làm việc này, trước tiên, bạn cần có Mã truy cập cá nhân (PAT) từ Github.

Sau khi có được đối tượng này, bạn sẽ cần thêm đối tượng MCP Server vào tệp settings.json. Dưới đây là tệp settings.json hoàn chỉnh trên hệ thống của tôi. Bạn có thể có các chế độ cài đặt bổ sung, nhưng đối tượng mcpServers phải như sau:

{
  "theme": "Default",
  "selectedAuthType": "oauth-personal",
  "mcpServers": {
       "github": {
            "httpUrl": "https://api.githubcopilot.com/mcp/",
            "headers": {
                "Authorization": "GITHUB_PAT"
            },
            "timeout": 5000
       }
  }
}

Bạn có thể khởi động lại Gemini CLI hoặc thực hiện lệnh /mcp refresh sau khi cập nhật settings.json bằng cấu hình Máy chủ MCP Github. Ảnh chụp màn hình bên dưới làm nổi bật Máy chủ MCP Github được định cấu hình trên máy của tôi và nhiều công cụ hiện có sẵn cho Gemini CLI để hoạt động với MCP.

Hãy bắt đầu bằng một câu lệnh sẽ kích hoạt một trong các công cụ của Máy chủ MCP trên Github. Đưa ra câu lệnh sau:

Lưu ý rằng công cụ này sẽ chọn công cụ phù hợp từ Máy chủ MCP của Github, nhưng cũng như các Công cụ tích hợp khác, bạn cũng cần phải cấp quyền rõ ràng để gọi công cụ này. Hãy tiếp tục và xem kết quả bạn nhận được.

Giờ đây, bạn nên làm việc với một trong các dự án trên Github. Đưa ra câu hỏi bằng ngôn ngữ tự nhiên, chẳng hạn như:

Hãy mô tả <repo-name> cho tôi?
Sao chép <repo-name> trên máy cục bộ của tôi.
Mô tả @<tên_tệp> hoặc @<tên_thư_mục>/
Kho lưu trữ này có những thành phần nào?
Tôi đã thực hiện các thay đổi cần thiết. Bạn có thể chuyển các thay đổi lên Github và sử dụng các công cụ Github MCP Server để thực hiện việc đó.

Chúng ta sẽ có một bài tập chi tiết về cách sử dụng Máy chủ MCP của Github ở phần sau của phòng thí nghiệm.

Máy chủ Context7 MCP

Context7 cung cấp tài liệu mới nhất cho LLM và trình chỉnh sửa mã AI. Nếu bạn muốn cung cấp ngữ cảnh cho LLM bằng tài liệu mới nhất về khung bạn chọn, thì máy chủ Context7 MCP là một lựa chọn phù hợp để định cấu hình.

Đảm bảo rằng bạn có thư viện được liệt kê trên trang chủ Context7.

Đây là MCP Server mà bạn cần thêm vào tệp settings.json.

"context7": {
      "httpUrl": "https://mcp.context7.com/mcp"
    }

Sau khi định cấu hình MCP Server và tải Gemini CLI thành công, bạn sẽ có thể xem các công cụ Context7 như sau:

Giờ đây, bạn có thể đưa ra câu lệnh cụ thể và yêu cầu Gemini CLI sử dụng Context7 để xem tài liệu mới nhất trong khi tạo ứng dụng hoặc đoạn mã bằng một khung XYZ cụ thể.

Dưới đây là một ví dụ về câu lệnh, trong đó tôi muốn viết một Đặc vụ bằng Bộ công cụ phát triển đặc vụ (ADK) của Google. Tôi đang chỉ định trong câu lệnh của mình để tra cứu tài liệu về vấn đề này thông qua Máy chủ Context7 MCP.

I am working on coding an Agent using the Agent Development Kit (ADK) from Google. I would like to know how to create the LLMAgent in Python. Use Context7 for the latest documentation on ADK and specifically use /google/adk-python, /google/adk-docs and adk.wiki

Sau đây là kết quả nhận được:

Máy chủ MCP của Google Trang trình bày

Dự án Github tại https://github.com/matteoantoci/google-slides-mcp cung cấp một máy chủ MCP để tương tác với Google Slides API. Thư viện này cho phép bạn tạo, đọc và sửa đổi bản trình bày trên Google Trang trình bày theo phương thức lập trình.

Các bước định cấu hình máy chủ MCP được cung cấp trong dự án. Bạn sẽ cần có một môi trường Node.js để tạo máy chủ, định cấu hình Dự án Google Cloud và mã thông báo OAuth 2.0, sau đó định cấu hình Máy chủ MCP trong tệp settings.json.

Sau khi thiết lập, bạn có thể chạy các câu lệnh như:

Trích xuất thông tin mới nhất từ "web_url", tóm tắt thành các điểm chính và tạo một bản trình bày có tên "my_presentation".

Hãy dùng thử!

Nhiều máy chủ MCP

Dưới đây là danh sách bổ sung các máy chủ MCP mà bạn có thể quan tâm:

Máy chủ MCP của Firebase
Các dịch vụ truyền thông của AI tạo sinh của Google (Imagen, Veo, Lyria)
MCP Toolbox for Databases (làm việc với Firestore, BigQuery, cơ sở dữ liệu Google Cloud)
Máy chủ MCP của Google Workspace (hoạt động với Tài liệu, Trang tính, Lịch, Gmail)

Hướng dẫn thiết lập các máy chủ MCP nêu trên được đăng trong bài đăng này trên blog.

6. Các trường hợp sử dụng để thử

Bạn có thể áp dụng Gemini CLI cho nhiều trường hợp sử dụng đối với cả nhà phát triển và người dùng không phải nhà phát triển. Sau đây là một số trường hợp và tuỳ thuộc vào lĩnh vực mà bạn quan tâm, bạn có thể thử bất kỳ hoặc tất cả các trường hợp này.

Trong mỗi trường hợp này, lời nhắc sẽ được cung cấp. Bạn có thể dùng thử tính năng này ở chế độ tương tác hoặc không tương tác của Gemini CLI thông qua tham số -p tại thời điểm khởi chạy Gemini CLI.

Sắp xếp tệp/thư mục

Bạn có thể sử dụng Gemini CLI để sắp xếp các tệp tuỳ theo loại trong nhiều thư mục khi cần. Chuyển đến một thư mục trên máy có nhiều tệp .txt, .png, .jpg, .pdf, .mp4 và các tệp khác. Đây thường là thư mục Desktop hoặc thư mục Tải xuống.

Chuyển đến thư mục đó rồi khởi động Gemini CLI. Trước tiên, chúng ta sẽ yêu cầu AI tạo một số thư mục cho chúng ta ở đây: Hình ảnh, Tài liệu, Video, sau đó chúng ta sẽ yêu cầu AI sắp xếp các tệp trong các thư mục đó.

Gemini CLI thường sẽ nhắc bạn cấp quyền trước khi thực thi các lệnh, đặc biệt là những lệnh sửa đổi hệ thống tệp (chẳng hạn như ghi, di chuyển hoặc xoá tệp). Luôn xem xét kỹ những lời nhắc này trước khi cấp quyền. Đây là biện pháp dự phòng cho bạn.

Create the following folders "Images","Documents","Videos"

Sau đó, hãy đưa ra câu lệnh sau:

Go through all the files in this folder and then organize them by moving all the files ending with .jpg, .jpeg, .gif into the "Images" folder. Move all ".txt" files into the "Documents" folder. Move all the ".mp4" files in the "Videos" folder.

Một số tình huống sắp xếp khác (các câu lệnh được đưa ra bên cạnh mỗi tình huống):

Tóm tắt: Đối với mỗi tài liệu trong thư mục "Tài liệu", hãy tạo một tệp txt trong cùng thư mục có tên là "summary_ORIGINAL_FILENAME.txt" chứa nội dung tóm tắt 3 câu về các điểm chính của tài liệu.
Phân loại theo loại: Quét tất cả tệp PDF và DOCX trong thư mục này. Di chuyển tất cả tệp có tên hoặc nội dung chứa từ "hoá đơn" vào thư mục "Tài chính/Hoá đơn". Di chuyển các tệp có "biên nhận" vào thư mục "Tài chính/Biên nhận". Mọi tệp .docx khác sẽ được chuyển vào thư mục "Báo cáo".
Trích xuất thông tin chính (và "gắn thẻ"): Đối với mỗi tệp PDF trong thư mục "Financial/Invoices" (Tài chính/Hoá đơn), hãy đọc nội dung của tệp đó. Nếu bạn tìm thấy ngày, hãy đổi tên tệp để thêm ngày đó theo định dạng YYYY-MM-DD, ví dụ: ‘invoice_2025-07-26_original_name.pdf'.