Tản mạn về Thread trong Java
This post hasn't been updated for 3 years
Thread vs Process
Process | Thread | |
---|---|---|
Khái niệm | Một chương trình đang chạy được gọi là một process. | Một chương trình chạy có thể có nhiều thread, Cho phép chương trình đó chạy trên nhiều luồng một cách "đồng thời". |
Không gian địa chỉ | Mỗi process có một không gian địa chỉ riêng biệt. | Tất cả thread thuộc một process chia sẻ không gian địa chỉ với nhau, hợp chúng lại thành một tiến trình. |
Đa nhiệm | Đa nhiệm dựa trên process cho phép máy tính chạy 2 hoặc nhiều hơn 2 chương trình đồng thời. | Đa nhiệm dựa trên thread cho phép một chương trình chạy trên 2 hoặc nhiều luồng đồng thời. |
Giao tiếp | Giao tiếp giữa 2 tiến trình là tốn kém và bị giới hạn. | Giao tiếp giữa 2 thread ít tốn kém hơn so với tiến trình. |
Thành phần | Một tiến trình có: không gian địa chỉ, biến global, xử lí tín hiệu, những tiến trình con, thông tin tính toán. | Một thread có: thanh ghi, trạng thái, stack, bộ đếm chương trình. |
Điều khiển | Đa nhiệm dựa trên process không thuộc quyền kiểm soát của Java. | Đa nhiệm dựa trên thread phụ thuộc quyền kiểm soát của Java. |
Concurrency vs Parallelism
Trong multi-threading có tồn tại 2 khái niệm là Concurrency (đồng thời) và Parallelism (song song). Thoạt đầu thì nghĩ chúng có vẻ giống nhau, nhưng chúng không phải là một.
Concurrency nghĩa là những tác vụ có thể bắt đầu, chạy, và hoàn thành trong những khoảng thời gian chống chéo lên nhau mà không theo thứ tự nào cả. Ví dụ: chạy trên 1 core processor. Còn Parallelism là nhiều tác vụ hoặc một phần của tác vụ chạy đồng thời tại cùng một thời điểm. Ví dụ: chạy trên multi-core processors.
Concurrency thực sự được ứng dụng khi chúng ta có ít nhất 2 tác vụ trở lên. Khi mà ứng dụng có thể thực hiện 2 task gần như cùng một thời điểm, chúng ta gọi đây là Concurent Application. Có thể chúng ta nhìn thấy nó gần như là thực hiện cùng 1 thời gian nhưng có vẻ không phải như vậy. Chúng tận dụng lợi thế của CPU time-slicing (Chia cắt thời gian) của hệ điều hành, mỗi tác vụ thực hiện nhiệm vụ của nó và chuyển sang trạng thái chờ. Khi tác vụ đầu tiên ở trạng thái chờ, CPU được gán cho tác vụ thứ 2 thực hiện nhiệm vụ của nó. Hệ điều hành dựa trên độ ưu tiên cũng từn task, sẽ phân chia CPU và tài nguyên để tính toán. Đối với người sử dụng, thấy dường như là các task được chạy một cách song song.
Parallelism không yêu cầu 2 task trở lên để tồn tại. Nó chạy một phần của task hoặc multi-task tại cùng 1 thời gian, dựa vào cấu trúc mult-core của CPU, bằng cách phân chia mỗi core của CPU thực hiện 1 task hoặc 1 sub-task. Parallelism yêu cầu phần cứng phải có nhiều đơn vị xử lí. Đối với CPU có 1 core, bạn có thể thực hiện Concurrency nhưng không thể là Parallelism.
Thread Pool
Để dễ hình dung, chúng ta hãy thử hóa thân thành ban tổ chức của 1 cái giải bơi lội cấp xã. Giả sử có 4 đội bơi tham gia tranh giải, và mỗi đội gồm có 5 vận động viên. Kết quả thi sẽ được tính bằng tổng thời gian bơi của tất cả các thành viên trong đội gộp lại. Bài toán đặt ra là chúng ta sẽ bố trí thể thức giải đấu như nào cho phù hợp?
- Giải pháp 1: Phân làn bể bơi làm 20 làn tương ứng với 20 bộ bấm giờ cho mỗi vận động viên. Cả 20 người thi cùng 1 lượt.
- Giải pháp 2: Phân làn bể bơi làm 4 làn và 4 bộ bấm giờ cho mỗi đội. Mỗi đội luân phiên bơi 4 người 1 lượt chia ra làm 5 lượt cả thảy.
Nhưng 1 chiếc bể vốn chỉ có dung tích giới hạn, việc phân quá nhiều làn sẽ khiến cho lưu thông mỗi làn bị tắc nghẽn. Giả sử tình huống số vận động viên tăng lên đáng kể, vấn đề sẽ càng trở nên nghiêm trọng hơn khi chả ai có khả năng bơi được vì làn bơi quá hẹp. Vậy nên giải pháp 2, tự đặt ra cố định chỉ phân ra làm 4 làn nghe hợp lí 1 cách rõ rệt, và giả như số lượng vận động viên có tăng lên, cũng chỉ khiến cho thời gian tính kết quả lâu hơn mà không khiến giải đấu trở nên nghẽn toàn bộ.
Java cho phép chúng ta thay vì phải tạo mới Thread cho mỗi task (mỗi vđv 1 làn bơi), thì các task đó được đưa vào trong một ThreadPool với một số lượng Thread cố định (1 bể bơi với số làn cố định). Khi có bất cứ 1Thread nào đang ở trạng thái rảnh rỗi trong pool, nó sẽ được lấy ra để gán với 1 task đang ở trạng thái chờ (khi làn bơi của đội đã có thành viên thi đấu xong, thì thành viên tiếp theo sẽ bắt đầu cuộc thi của mình tại chính làn đó). Điều này sẽ giúp khắc phục được sự tắc nghẽn và chương trình sẽ kiểm soát được các luồng thực thi. Vì mỗi khi có một Thread mới được tạo ra và được cấp phát bộ nhớ bằng từ hóa new thì sẽ có vấn đề bộ nhớ và hiệu suất, có thể dẫn tới crash chương trình.
Các cách khởi tạo thread
1. Kế thừa từ lớp Thread
public class Main {
public static class MyThread extends Thread {
@Override
public void run() {
try {
Thread.sleep(1000);
System.out.println("My thread: done");
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
public static void main(String[] args) {
new MyThread().run();
}
}
2. Implement từ Interface Runnable
public class Main {
public static class MyThread implements Runnable {
@Override
public void run() {
try {
Thread.sleep(1000);
System.out.println("My thread: done");
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
public static void main(String[] args) {
new MyThread().run();
}
}
Hoặc sử dụng tính năng Lambda trong Java 8 vì Runnable là 1 Functional Interface:
public class Main {
public static void main(String[] args) {
Runnable task = () -> {
try {
Thread.sleep(1000);
System.out.println("Task done!");
} catch (InterruptedException e) {
e.printStackTrace();
}
};
new Thread(task).run();
}
}
3. Sử dụng ExecutorService để tạo threads pool
3.1. Khởi tạo ExecuteService
Executors.newSingleThreadExecutor()
: Trong ThreadPool chỉ có 1 Thread và các task sẽ được sử lý một cách tuần tự.Executors.newCachedThreadPool()
: Trong ThreadPool sẽ có rất nhiều Thread. Các task sẽ được sử lý một cách song song. Các Thread cũ sau khi sử lý xong sẽ được sử dụng lại cho tác vụ mới. Mặc định nếu một Thread không được sử dụng trong vào 60 giây thì Thread đó sẽ được hủy (shut down).Executors.newFixedThreadPool(int)
: Trong ThreadPool sẽ được cố định (fixed) số lượng các Thread. Nếu một task mới được đưa vào mà các thread đều đang “bận rộn” thì task đó sẽ được gửi vào Blocking Queue và ngay sau khi một Thread đã thực thi xong nhiệm vụ của nó thì nhiệm vụ đang ở trong Queue đó sẽ được push ra khỏi Queue và được Thread đó xử lý tiếp.Executors.newScheduledThreadPool(int)
: Tương tự như “Cached Thread Pool” nhưng sẽ có khoảng delay giữa các Thread.Executors.newSingleThreadScheduledExecutor()
: Tương tự như “Single Thread Executor” nhưng sẽ có khoảng delay giữa các Thread
3.2. Sử dụng
execute(Runnable)
: Thực thi tác vụ, không có callback hoặc giá trị trả về khi thực hiện xong nhiệm vụ.submit(Runnable)
: Thực thi tác vụ và trả về một đối tượng Future - được sử dụng để kiểm tra nếu đã hoàn tất việc thực thi.submit(Callable)
: Tương tự như trên nhưng có thể trả về 1 giá trị xác định mang tính thành quả sau khi hòan thành tác vụ, cũng được gán vào Future.invokeAny(Collection<?> extends Callable)
: Thực thi một tập các tác vụ, trả về kết quả của task hoàn thành đầu tiên (phát sinh Exception cũng tính là hoàn thành task). Chỉ cần 1 trong các tác vụ hòan thành, các task còn lại sẽ được hủy bỏ.invokeAll(Collection<?> extends Callable)
: Thực thi một tập các tác vụ và trả về kết quả của chúng - 1List<Future>
.
Thread lifecycle
Thread.State.NEW
: Đây là trạng thái khi luồng vừa được khởi tạo bằng phương thức khởi tạo của lớp Thread nhưng chưa được start(). Ở trạng thái này, luồng được tạo ra nhưng chưa được cấp phát tài nguyên và cũng chưa chạy. Nếu luồng đang ở trạng thái này mà ta gọi các phương thức ép buộc stop,resume,suspend … sẽ là nguyên nhân sảy ra ngoại lệ IllegalThreadStateException .Thread.State.RUNNABLE
: Sau khi gọi phương thức start() thì luồng test đã được cấp phát tài nguyên và các lịch điều phối CPU cho luồng test cũng bắt đầu có hiệu lực. Ở đây, chúng ta dùng trạng thái là Runnable chứ không phải Running, vì như đã nói ở phần đầu (Các mô hình đa luồng) thì luồng không thực sự luôn chạy mà tùy vào hệ thống mà có sự điều phối CPU khác nhau.Thread.State.BLOCKED
: Đây là 1 dạng của trạng thái “Not Runnable”. Thread chờ 1 đối tượng bị lock bởi JVM MonitorThread.State.WAITING
: Đây là 1 dạng của trạng thái “Not Runnable”. Thread đang chờ 1 notify() từ 1 thread khác. Thread rơi vào trạng thái này do phương thức wait() hoặc join()Thread.State.TIMED_WAITING
: Đây là 1 dạng của trạng thái “Not Runnable”. Thread đang chờ 1 notify() từ 1 thread khác trong 1 thời gian nhất định, Thread rơi vào trạng thái này do phương thức wait(long timeout) hoặc join(long timeout)Thread.State.TERMINATED
: Thread đã hoàn thành công việc trong run() hoặc bị stop()
Các phương thức thông dụng
suspend()
: Đây là phương thức làm tạm dừng hoạt động của 1 luồng nào đó bằng các ngưng cung cấp CPU cho luồng này. Để cung cấp lại CPU cho luồng ta sử dụng phương thức resume(). Cần lưu ý 1 điều là ta không thể dừng ngay hoạt động của luồng bằng phương thức này. Phương thức suspend() không dừng ngay tức thì hoạt động của luồng mà sau khi luồng này trả CPU về cho hệ điều hành thì không cấp CPU cho luồng nữa.resume()
: Đây là phương thức làm cho luồng chạy lại khi luồng bị dừng do phương thức suspend() bên trên. Phương thức này sẽ đưa luồng vào lại lịch điều phối CPU để luồng được cấp CPU chạy lại bình thường.stop()
: Luồng này sẽ kết thúc phương thức run() bằng cách ném ra 1 ngoại lệ ThreadDeath, điều này cũng sẽ làm luồng kết thúc 1 cách ép buộc. Nếu giả sử, trước khi gọi stop() mà luồng đang nắm giữa 1 đối tượng nào đó hoặc 1 tài nguyên nào đó mà luồng khác đang chờ thì có thể dẫn tới việc sảy ra deadlock.isAlive()
: Phương thức này kiểm tra xem luồng còn active hay không. Phương thức sẽ trả về true nếu luồng đã được start() và chưa rơi vào trạng thái dead. Nếu phương thức trả về false thì luồng đang ở trạng thái “New Thread” hoặc là đang ở trạng thái “Dead”yeild()
: Hệ điều hành đa nhiệm sẽ phân phối CPU cho các tiến trình, các luồng theo vòng xoay. Mỗi luồng sẽ được cấp CPU trong 1 khoảng thời gian nhất định, sau đó trả lại CPU cho HĐH, HĐH sẽ cấp CPU cho luồng khác. Các luồng sẽ nằm chờ trong hàng đợi Ready để nhận CPU theo thứ tự. Java có cung cấp cho chúng ta 1 phương thức khá đặc biệt là yeild(), khi gọi phương thức này luồng sẽ bị ngừng cấp CPU và nhường cho luồng tiếp theo trong hàng chờ Ready. Luồng không phải ngưng cấp CPU như suspend mà chỉ ngưng cấp trong lần nhận CPU đó mà thôi.
All Rights Reserved