程式筆記本

2025年4月30日星期三

Ubuntu 20.04 上製作 Docker Image

這篇文章我們要把一個 shell script 放進 Docker image 裡面

廢話不多說

首先要開 terminal 然後 cd 到 .sh 的位置

就假設這個 .sh 的位置是 /home/aaa/bbb/ccc/xxx.sh

所以就 cd /home/aaa/bbb/ccc

1. 輸入 sudo vim Dockerfile

進入 vim 後先按 i

然後輸入或貼上以下內容

# Use a base image, such as Ubuntu
FROM ubuntu:20.04

# Set environment variables to avoid prompts during installation
ENV DEBIAN_FRONTEND=noninteractive

# Install necessary dependencies (adjust based on your script's needs)
RUN apt update && apt install -y \
    bash \
    libgl1-mesa-glx \
    && apt clean

# Copy your script into the container
COPY xxx.sh /home/aaa/bbb/ccc/xxx.sh
COPY folder /home/aaa/bbb/ccc/folder


# Make the script executable
RUN chmod +x /home/aaa/bbb/ccc/xxx.sh

# Set the working directory (optional, for context)
WORKDIR /home/aaa/bbb/ccc/latest

# Set the script to run when the container starts
CMD ["./xxx.sh"]

註1: 在實際執行時我的 .sh 跳出 error 說缺少 libGL.so.1

所以我必須另外安裝 libgl1-mesa-glx

註2: 如果要複製資料夾就按照黃色字的寫法就可以了

註3. COPY到 container 裡面時其實不必按照外面的路徑

我選用一樣的路徑是個人覺得這樣比較簡單明瞭

2. 建立 image

docker build -t your-image-name .

注意最後的那個 "." 不能省略，表示當前目錄的意思

3. 執行 image

docker run -d --name your-container-name your-image-name

4. 除錯

如果程式跑起來不如預期

我們可以使用以下指令看到 container 執行時的 ternimal output

sudo docker logs your-container-name

5. 網路 ip

通常我們的內網 ip 會是 192.168.0.xx 這樣的數字

但是 container 內部的 ip 是 172.17.0.2

我的程式會先查看自己的 ip 多少，然後跟別台主機說 ip 是什麼

結果報出去的這個 172.17.0.2 是外面連不進來的

以下講幾種 chatgpt 提供的解決方法

(a) Pass the Host IP as an Environment Variable

a-1

docker run -d --name container-name -p host_ip:host_port:container_port -e HOST_IP=192.168.0.xx image-name

a-2

host_ip = os.getenv("HOST_IP", "127.0.0.1")  # Example in Python

但是我不想動到 python 那邊的 code

所以沒用這方法

(b) Fetch the Host IP Dynamically in the Container

import socket
import os

def get_host_ip():
    try:
        # Get the default gateway IP
        gateway_ip = os.popen("ip route | grep default | awk '{print $3}'").read().strip()
        return gateway_ip
    except Exception as e:
        return "127.0.0.1"

host_ip = get_host_ip()

這也是要改 python 所以跳過

docker run -d --name container-name --network=host image-name

用這方法啟動 container 就成功的解決我的問題

後面其實還提到了 Use a Reverse Proxy, Modify Client-Side Logic

然後還講到

If the host IP is static or known at runtime, use Solution 1 (Environment Variable).

If the IP changes dynamically, use Solution 2 (Fetch Gateway IP) or Solution 3 (Host Network Mode).

總之，大概記錄一下遇到的問題，就講到這

2025年3月31日星期一

Ubuntu 20.04 上使用 Docker / Container

大語言模型教得很好，真的不必再到處 google 了

如何安裝 Docker / Container 這邊就簡單講一下

也許以後的方法又不一樣

1. 更新現有套件

sudo apt update && sudo apt upgrade -y

2. 安裝相關套件

sudo apt install -y apt-transport-https ca-certificates curl software-properties-common

3. 加入 Docker 官方 GPG Key

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg

4. 設置 Stable Repository

echo "deb [arch=$(dpkg --print-architecture) signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

5. 安裝 Docker

sudo apt update
sudo apt install -y docker-ce docker-ce-cli containerd.io

6. 啟用 Docker

sudo systemctl enable docker
sudo systemctl start docker

7. 查看版本

sudo docker --version
sudo docker compose version

8. 運行 hello world 容器

sudo docker run hello-world

如果成功的話應該會看到一段 Hello from Docker 訊息

這邊就不貼了

然後以下是幾個常用指令

(a) 列出所有 image

sudo docker images

(b) 執行 image

sudo docker run -d --name container-name image-name

images 就是躺在 disk 裡面的東西

使用 docker run 它就會載入變成 container

這個 container-name 不能重複

至於怎麼製作 image 我們在下一篇文章再講

sudo docker ps -a

列出正在運行的 container

sudo docker ps

(d) 停止 container

sudo docker stop container-name

(e) 執行 container

如果之前已經使用過 run 把 image 變成 container

那麼再次啟動時要使用 start

sudo docker start container-name

(f) 移除 container

sudo docker rm container-name

(g) 移除 image

sudo docker rmi image-name

上面提到的都是使用 "container name" & "image name"

但其實也可以用 "container id" & "image id"

差不多講到這

2025年3月1日星期六

如何在 ubuntu 20.04 把 shell script 寫成 service

首先，當你有問題時，第一個該試的就是問大語言模型

大語言模型回答得很好

我這邊就簡單的講一下所需步驟

1. 建立 systemd service unit file

基本上這類型的檔案都會放在 /etc/systemd/system 這個目錄下

舉例來說，我的 script 叫做 my-script.sh

而我想要建立一個 my-script.service

我只需要打開 terminal 並執行

sudo nano /etc/systemd/system/my-script.service

2. 在上面的指令打開檔案後，加入下列內容

[Unit]
Description=My Custom Script
After=network.target

[Service]
ExecStart=/bin/bash /path/to/your/script.sh
WorkingDirectory=/path/to/working/directory
StandardOutput=journal
StandardError=journal
Restart=on-failure
User=your_user_name
Group=your_group_name

[Install]
WantedBy=multi-user.target

這邊補充一些項目

(a) ExecStart 其實可以寫成

ExecStart="/path/to/your/script.sh"

然後以我自己的情況來說

(b) WorkingDirectory 我會寫成 sh 的 folder

也就是下面這樣

WorkingDirectory=/path/to/your

After=

直接刪掉也許也可以吧

(d) Restart 除了 "on-failure" 之外，還有 "always"

(e) 還有一個參數叫做 RestartSec

RestartSec=60

應該是掛掉後隔 60 秒再啟動

(f) User, Group 那些都可以刪掉沒差

sudo apt update
sudo apt install samba

(g) Type 目前遇到都是寫 simple 就可以了

(h) StandardOutput, StandardError 用來輸出 logs (目前沒用過)

3. 重新讀取 service file

sudo systemctl daemon-reload

4. 啟用 service

sudo systemctl enable my-script.service

5. 開始 service

sudo systemctl start my-script.service

6. 檢查 service 狀態

sudo systemctl status my-script.service

7. 停止 service

sudo systemctl stop my-script.service

註: 如果你的 sh 沒有執行權限，可以使用下列指令

chmod +x /path/to/your/script.sh

大概就這樣吧，寫成 service 就可以很輕鬆地背景執行了

2025年1月31日星期五

2024年12月31日星期二

ubuntu 20.04 安裝 CUDA 12.2 for RTX 3060

這兩天按照之前自己寫的步驟來裝 NV Driver

結果又有問題了

裝到 cuda 的時候，出現以下畫面

重新來來回回弄好了幾遍

就是不行，順道提一下清除指令如下

sudo apt-get --purge remove nvidia-* <-- 新發現 sudo apt-get --purge remove "*nvidia*" <-- 新發現 sudo apt purge nvidia* -y sudo apt remove nvidia-* -y sudo rm /etc/apt/sources.list.d/cuda* sudo apt autoremove -y && sudo apt autoclean -y sudo rm -rf /usr/local/cuda*

另外記錄一下幾個可能有用的指令

* 查看驅動版本號

sudo dpkg --list | grep nvidia-*

-----------------------------------------------------------------------------------

簡單來說

之前安裝 driver 的部分是沒問題的

可以按照之前的說明安裝

但 driver 535 版本看起來是 CUDA 12.2

所以這次就改裝 12.2 吧

首先，到以下網址

https://developer.nvidia.com/cuda-12-2-0-download-archive

要裝在 ubuntu 20.04 上

所以選 linux -> x86_64 -> Ubuntu -> 20.04 -> runfile (local)

然後出現

Installation Instructions:
`wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda_12.2.0_535.54.03_linux.runsudo sh cuda_12.2.0_535.54.03_linux.run`

照著做，執行 sh 後，他會說已偵測到有其他安裝程式之類的

強烈建議你不要繼續，別理他，選繼續

會出現以下畫面

這真的讓人搞不懂

前面的X到底是要選還是不要選

答案是，有X是要選的

driver 我們剛才裝過了

註 : 這個 sh 也能安裝 driver，但似乎要 OS 進入 cmd 模式才行? 不確定是不是但太麻煩了

所以只要選 CUDA 就好

安裝完成後他會說找不到 driver 之類的

不用理他，我們可以用以下指令檢查

nvidia-smi <-- driver 有安裝才會 work

nvcc -V <-- cuda 有安裝才會 work

但是在使用 nvcc -V 之前，還得自行更新 library path 的位置

指令如下

# setup your paths echo 'export PATH=/usr/local/cuda-12.2/bin:$PATH' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc source ~/.bashrc sudo ldconfig

成功的話 nvcc -V 之後就會出現 cuda 的版號

失敗的話可以用最上面提到的清除指令重來

--------------------------------------------------------------------------------------

再來要安裝 cuDnn，先到以下網址

https://developer.nvidia.com/rdp/cudnn-archive

其實 cuDnn 已經到 9.x 了

但我是 RTX 3060 應該不用那麼新吧

總之我是選了 cuDNN v8.9.7 (December 5th, 2023), for CUDA 12.x 這個

NV 還要你註冊才給你下載，就註冊吧，下載完就像下面這樣

然後用以下指令安裝 cuDnn

CUDNN_TAR_FILE="cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz" sudo tar -xvf ${CUDNN_TAR_FILE} sudo mv cudnn-linux-x86_64-8.9.7.84_cuda12-archive cuda # copy the following files into the cuda toolkit directory. sudo cp -P cuda/include/cudnn.h /usr/local/cuda-12.2/include sudo cp -P cuda/lib/libcudnn* /usr/local/cuda-12.2/lib64/ sudo chmod a+r /usr/local/cuda-11.2/lib64/libcudnn*

這些都做完後

自己開個 pytorch 的專案來跑一下訓練

是有用 gpu 在跑的 !

以上做個紀錄

2024年12月2日星期一

flask 連線遠端 mysql 主機

在上一篇文章中

我們已經安裝好一台 ubuntu 20.04 並安裝了 mySQL ，版本是 8.0.44

現在我們在另一台電腦(windows)上開發 flask

一個最簡單的 flask 寫法如下

from flask import Flask

app = Flask(__name__)

@app.route('/')
def hello():
    return 'Welcome to My Watchlist!'

if __name__ == '__main__':
    app.run(debug=True)

然後需要安裝 mySQL client 的套件，我選的套件是 mysql-connector-python

所以安裝方法就是 pip install mysql-connector-python

這裡有個坑，套件名稱千萬不要打成 mysql-connector

Summary of Steps to Resolve:

Ensure MySQL is running on 192.168.0.31.
Open port 3306 on the firewall of the MySQL server.
Update MySQL bind-address in the configuration to allow remote connections.
Grant remote access privileges to the MySQL user.

1. 在 mySQL 安裝的 ubuntu 上輸入 sudo service mysql status 即可確認

2. 這邊 chatgpt 丟出了一句 sudo ufw allow 3306

首先 ufw 應該是預設有安裝的，但我們可以檢查一下狀態

$ ufw enable // 啟動防火牆，執行後開機也會自動啟動

$ ufw disable // 關閉防火牆

$ ufw status // 查看防火牆狀態

$ ufw status verbose // 查看防火牆詳細狀態

基本上就是把 3306 port 打開，這部分沒啥問題

2025年4月30日 星期三

Ubuntu 20.04 上 製作 Docker Image

2025年3月31日 星期一