Proxmox - GUI "friert ein"

Du solltest an die Smart Werte nach einen Reboot kommen. In deinem Fehler wahrscheinlich eher ein harter Reset mit Stecker ziehen weil das System auf die problematische nvme wartet.
 
Ich habe nach dem harten Runterfahren die 20 TB HDD abgestöpselt, damit ich die schonen kann.
Proxmox fährt jetzt nicht mehr normal hoch, sondern ist im "emergency mode":

"Timed out waiting for device dev-sdb1.device - dev/sdb1"

Ich habe also Monitor und Tastatur angeschlossen.

Ich habe auch die SSD mal ausgebaut, komme dann aber wieder nur auf den emergency mode.
Lustigerweise macht er ein "apt update" ... Proxmox scheint also noch nicht tot zu sein.

Auf der kaputten Platte hatte ich, soweit ich das erinnern kann, Home Assistant und Ubuntu (Docker: Immich) drauf. Also quasi nur die VMs, nichts was für Proxmox ansich lebensnotwendig sein sollte.
Ich habe mit Proxmox internem Backupdienst die VMs auch auf die 20 TB HDD gesichert, weiß aber nicht wie alt das letze Backup der Ubuntu VM ist.
Die Bilder und Datenbank von Immich hatte ich auch auf die HDD gelegt. Also sollte es "nur" die Ubuntu-VM sein, die auf der defekten Platte liegt.

Aber Proxmox sollte doch auch ohne die defekte SSD normal starten können?

Ich werde, wie CoMo vorgeschlagen hat, versuchen die Stromsparmodi auszustellen im BIOS.
Ergänzung ()

UPDATE: Hier die Smart Werte

Code:
=== /dev/sda ===
smartctl 7.5 2025-04-30 r5714 [x86_64-linux-6.17.13-2-pve] (local build)
Copyright (C) 2002-25, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Samsung based SSDs
Device Model:     Samsung SSD 850 EVO 120GB
Serial Number:    S21UNXAGA86770L
LU WWN Device Id: 5 002538 d4072c8e1
Firmware Version: EMT02B6Q
User Capacity:    120,033,041,920 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
TRIM Command:     Available
Device is:        In smartctl database 7.5/5706
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon May 18 17:48:41 2026 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (    0) seconds.
Offline data collection
capabilities:                    (0x53) SMART execute Offline immediate.
                                        Auto Offline data collection on/off supp                                                                            ort.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  64) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_                                                                            FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -                                                                                   0
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -                                                                                   9498
 12 Power_Cycle_Count       0x0032   098   098   000    Old_age   Always       -                                                                                   1215
177 Wear_Leveling_Count     0x0013   098   098   000    Pre-fail  Always       -                                                                                   34
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -                                                                                   0
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -                                                                                   0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -                                                                                   0
183 Runtime_Bad_Block       0x0013   100   099   010    Pre-fail  Always       -                                                                                   0
187 Uncorrectable_Error_Cnt 0x0032   100   100   000    Old_age   Always       -                                                                                   0
190 Airflow_Temperature_Cel 0x0032   082   062   000    Old_age   Always       -                                                                                   18
195 ECC_Error_Rate          0x001a   200   200   000    Old_age   Always       -                                                                                   0
199 CRC_Error_Count         0x003e   071   071   000    Old_age   Always       -                                                                                   28907
235 POR_Recovery_Count      0x0012   099   099   000    Old_age   Always       -                                                                                   278
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -                                                                                   5505857634

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

Warning! SMART Selective Self-Test Log Structure error: invalid SMART checksum.
SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
  255        0    65535  Read_scanning was never started
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

The above only provides legacy SMART information - try 'smartctl -x' for more


=== /dev/sdb ===
smartctl 7.5 2025-04-30 r5714 [x86_64-linux-6.17.13-2-pve] (local build)
Copyright (C) 2002-25, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Toshiba MG10AFA... Enterprise Capacity HDD
Device Model:     TOSHIBA MG10AFA22TE
Serial Number:    Z4F0A0LDFM8J
LU WWN Device Id: 5 000039 db8d1677a
Firmware Version: 0102
User Capacity:    22,000,969,973,760 bytes [22.0 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database 7.5/5706
ATA Version is:   ACS-4 T13/BSR INCITS 529 revision 5
SATA Version is:  SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon May 18 17:48:41 2026 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (  120) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off supp                                                                            ort.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (1782) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_                                                                            FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   050    Pre-fail  Always       -                                                                                   0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -                                                                                   0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -                                                                                   9412
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -                                                                                   18
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -                                                                                   0
  7 Seek_Error_Rate         0x000b   100   100   050    Pre-fail  Always       -                                                                                   0
  8 Seek_Time_Performance   0x0005   100   100   050    Pre-fail  Offline      -                                                                                   0
  9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -                                                                                   2762
 10 Spin_Retry_Count        0x0033   100   100   030    Pre-fail  Always       -                                                                                   0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -                                                                                   18
 23 Helium_Condition_Lower  0x0023   100   100   075    Pre-fail  Always       -                                                                                   0
 24 Helium_Condition_Upper  0x0023   100   100   075    Pre-fail  Always       -                                                                                   0
 27 MAMR_Health_Monitor     0x0023   100   100   030    Pre-fail  Always       -                                                                                   1248333
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -                                                                                   0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -                                                                                   10
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -                                                                                   479
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -                                                                                   24 (Min/Max 15/40)
196 Reallocated_Event_Count 0x0033   100   100   010    Pre-fail  Always       -                                                                                   0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -                                                                                   0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -                                                                                   0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -                                                                                   0
220 Disk_Shift              0x0002   100   100   000    Old_age   Always       -                                                                                   524288
222 Loaded_Hours            0x0032   097   097   000    Old_age   Always       -                                                                                   1550
226 Load-in_Time            0x0026   100   100   000    Old_age   Always       -                                                                                   701
240 Head_Flying_Hours       0x0001   100   100   001    Pre-fail  Offline      -                                                                                   0
241 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -                                                                                   8225707624
242 Total_LBAs_Read         0x0032   100   100   000    Old_age   Always       -                                                                                   1796570123

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

The above only provides legacy SMART information - try 'smartctl -x' for more


=== /dev/nvme0 ===
smartctl 7.5 2025-04-30 r5714 [x86_64-linux-6.17.13-2-pve] (local build)
Copyright (C) 2002-25, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       INTEL SSDPEKNW512G8H
Serial Number:                      BTNH94140WP0512A
Firmware Version:                   HPS2
PCI Vendor/Subsystem ID:            0x8086
IEEE OUI Identifier:                0x5cd2e4
Controller ID:                      1
NVMe Version:                       1.3
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512,110,190,592 [512 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Mon May 18 17:48:41 2026 CEST
Firmware Updates (0x14):            2 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Ti                                                                            mestmp
Log Page Attributes (0x0f):         S/H_per_NS Cmd_Eff_Lg Ext_Get_Lg Telmtry_Lg
Maximum Data Transfer Size:         32 Pages
Warning  Comp. Temp. Threshold:     77 Celsius
Critical Comp. Temp. Threshold:     80 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     3.50W       -        -    0  0  0  0        0       0
 1 +     2.70W       -        -    1  1  1  1        0       0
 2 +     2.00W       -        -    2  2  2  2        0       0
 3 -   0.0250W       -        -    3  3  3  3     5000    5000
 4 -   0.0040W       -        -    4  4  4  4     5000    9000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02, NSID 0xffffffff)
Critical Warning:                   0x00
Temperature:                        23 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    7%
Data Units Read:                    26,884,504 [13.7 TB]
Data Units Written:                 47,389,847 [24.2 TB]
Host Read Commands:                 397,208,230
Host Write Commands:                1,114,620,762
Controller Busy Time:               37,774
Power Cycles:                       2,223
Power On Hours:                     15,652
Unsafe Shutdowns:                   225
Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Thermal Temp. 1 Transition Count:   64
Thermal Temp. 1 Total Time:         351

Error Information (NVMe Log 0x01, 16 of 256 entries)
No Errors Logged

Self-test Log (NVMe Log 0x06, NSID 0xffffffff)
Self-test status: No self-test in progress
Num  Test_Description  Status                       Power_on_Hours  Failing_LBA                                                                              NSID Seg SCT Code
 0   Short             Completed without error                1372            -                                                                                 -   -   -    -


=== /dev/nvme1 ===
smartctl 7.5 2025-04-30 r5714 [x86_64-linux-6.17.13-2-pve] (local build)
Copyright (C) 2002-25, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       SAMSUNG MZVLW256HEHP-000H7
Serial Number:                      S365NA0K505218
Firmware Version:                   CXB73H7Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Total NVM Capacity:                 256,060,514,304 [256 GB]
Unallocated NVM Capacity:           0
Controller ID:                      2
NVMe Version:                       1.2
Number of Namespaces:               1
Namespace 1 Size/Capacity:          256,060,514,304 [256 GB]
Namespace 1 Utilization:            96,361,463,808 [96.3 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            002538 b5810520a3
Local Time is:                      Mon May 18 17:48:41 2026 CEST
Firmware Updates (0x16):            3 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x001f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Log Page Attributes (0x03):         S/H_per_NS Cmd_Eff_Lg
Warning  Comp. Temp. Threshold:     68 Celsius
Critical Comp. Temp. Threshold:     71 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     7.60W       -        -    0  0  0  0        0       0
 1 +     6.00W       -        -    1  1  1  1        0       0
 2 +     5.10W       -        -    2  2  2  2        0       0
 3 -   0.0400W       -        -    3  3  3  3      210    1500
 4 -   0.0050W       -        -    4  4  4  4     2200    6000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02, NSID 0xffffffff)
Critical Warning:                   0x00
Temperature:                        30 Celsius
Available Spare:                    100%
Available Spare Threshold:          5%
Percentage Used:                    1%
Data Units Read:                    78,205,236 [40.0 TB]
Data Units Written:                 13,087,034 [6.70 TB]
Host Read Commands:                 1,200,783,536
Host Write Commands:                312,721,894
Controller Busy Time:               1,989
Power Cycles:                       699
Power On Hours:                     1,293
Unsafe Shutdowns:                   31
Media and Data Integrity Errors:    0
Error Information Log Entries:      3,873
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               30 Celsius
Temperature Sensor 2:               36 Celsius

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS  Message
  0       3873     0  0x100d  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  1       3872     0  0x3011  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  2       3871     0  0x4012  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  3       3870     0  0x0014  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  4       3869     0  0x100c  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  5       3868     0  0x000c  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  6       3867     0  0x0009  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  7       3866     0  0x0008  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  8       3865     0  0x0018  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
  9       3864     0  0x0004  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
 10       3863     0  0x000c  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
 11       3862     0  0x1000  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
 12       3861     0  0x000c  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
 13       3860     0  0x0008  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
 14       3859     0  0x0014  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
 15       3858     0  0x0014  0x4004      -            0     0     -  Invalid Fi                                                                            eld in Command
... (48 entries not read)

Self-test Log (NVMe Log 0x06, NSID 0xffffffff)
Self-test status: No self-test in progress
No Self-tests Logged
 
Zuletzt bearbeitet:
In der fstab eingetragene Platten müssen beim Start vorhanden sein. Das lässt sich umgehen durch die Option nofail.
 
@cbtaste420 Danke! Ich habe es jetzt so gemacht:

/dev/pve/root / ext4 errors=remount-ro 0 1
UUID=B4E3-374E /boot/efi vfat defaults 0 1
/dev/pve/swap none swap sw 0 0
proc /proc proc defaults 0 0
/dev/sdb1 /mnt/daten22tb ext4 defaults,nofail 0 2
10.100.2.61:/mnt/daten22tb/media /mnt/media-jellyfin nfs defaults,_netdev 0 0


Ist das richtig?
--

Die beiden NVMEs sind als ThinVolume eingebunden. Wie sollte ich weitermachen, wenn die NVME1 kaputt ist?
 
Felix_krueger schrieb:
476.9G INTEL SSDPEKNW512G8H
Das ist eine intel 660p.
QLC Chips der ersten generationen, bei denen die zellen ab 100 writes anfangen zu sterben.
Das war mein initialer verdacht
Ich habe noch nicht auf die smart werte geschaut, wette aber, dass die einfach im sterben liegt

Felix_krueger schrieb:
Die beiden NVMEs sind als ThinVolume eingebunden. Wie sollte ich weitermachen, wenn die NVME1 kaputt ist?
entsorgen und backup einspielen
Ergänzung ()

Felix_krueger schrieb:
/dev/sdb1 /mnt/daten22tb ext4 defaults,nofail 0 2
lgtm:)

ob fstab richtig ist oder nicht kannst und solltest du vor einem reboot mit sudo mount -a testen
wenn was nicht stimmt, siehst du es dann
 
Neue SSD klingt gut.
Aber ich stehe leider noch auf dem Schlauch.

(I) Damit Proxmox weiterhin bootet, auch wenn die Platte ausgebaut ist, was muss ich machen?

[ (II) Meine VMs auf die andere SSD umziehen? - das sollte ich mir ergoogeln können und selber hinbekommen]

(III) Und das ThinVolume dann irgendwie auflösen ...? Aber wie?

Bei I und III bräuchte ich Input ^^
 
Was liegt drauf?
Zeig mal bitte die /etc/pve/storage.cfg
Und noch in welcher Form liegt das Backup vor?
 
Code:
  GNU nano 8.4                                                            /etc/pve/storage.cfg
dir: local
        path /var/lib/vz
        content vztmpl, snippets

lvmthin: nvme500gb
        thinpool LVM-Thin-500GB-thin
        vgname LVM-Thin-500GB
        content rootdir,images

lvmthin: nvme250gb
        thinpool LVM-Thin-250GB-thin
        vgname LVM-Thin-250GB
        content images,rootdir

cifs: smb-pve-22tb
        path /mnt/pve/smb-pve-22tb
        server 10.100.2.61
        share media
        content iso,backup,images
        prune-backups keep-all=1
        subdir /pve_dateien/backups_und_pve_medien
        username shareuser
Ergänzung ()

Mir scheint es fast als sei auf der Platte nichts wichtiges drauf, da ja meine wichtigen VMs / lxc funktionieren.
Wie kann ich die Festplatte sauber aus Proxmox entfernen, sodass ich sie ausbauen kann?

Einfach aus /etc/pve/storage.cfg
Code:
lvmthin: nvme500gb
        thinpool LVM-Thin-500GB-thin
        vgname LVM-Thin-500GB
        content rootdir,images

löschen?


//

Oder im GUI "Remove":
1779122316913.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: madmax2010
Beides tut das gleiche. Die datei ist, was du in der UI siehst.
Links unten am Rand in der UI kannst du auch sehen was auf den volumes jeweils liegt

Du kannst aber auch eine neue SSD direkt an der stelle nutzen. Aber wenn nichts drauf liegt, hau weg:)
 
Vielen Dank an alle, die hier unterstützt haben! Ich hätte mal früher um eure Hilfe fragen sollen und nicht wiederholt meinen Server hart stoppen sollen.

Auf der defekten SSD lagen doch meine VMs & lxc. Nicht weiter schlimm, weil ich auf die andere SSD (das 500GB LVM-Thin) per "Restore" aus meinen Backupdateien, die auf der HDD lagen, wiederhergestellt habe.
Danach habe ich dann das 250GB LVM-Thin entfernt und die defekte SSD schlussendlich ausgebaut.

Home Assistant und Ubuntu/Docker laufen wieder wie 'ne eins!

Habt ihr noch einen letzten Tipp, wie ich meinen Proxmox Host sichern kann? Proxmox Backup Server (PBS) wäre sicher schön, aber dann bräuchte ich einen weiteren Server. Welche anderen Möglichkeiten hätte ich?
 
  • Gefällt mir
Reaktionen: madmax2010
Felix_krueger schrieb:
Proxmox Backup Server (PBS) wäre sicher schön, aber dann bräuchte ich einen weiteren Server.

Grundsätzlich kannst du PBS auch auf derselben Maschine wie PVE betreiben, solange der Storage woanders liegt. Das ist dann etwas mehr Aufwand beim Disaster Recovery, aber du hast trotzdem die PBS Vorteile wie Deduplizierung. Der PBS auf meinem RZ Server läuft in einem LXC Container.

Eine separate Maschine ist natürlich vorzuziehen, wenn möglich. Das ist bei mir zuhause ein 15€ Thin Client, bei dem ich RAM und SSD nachgerüstet habe. Der Datastore liegt auf dem NAS und via Sync Job landen da auch die Backups des anderen PBS.
 
Super, dann gönne ich meiner PVE gleich mal einen PBS. Ich dachte, dass das wegen der Rekursivität nicht wirklich funktioniert, aber das meinst du wahrscheinlich mit "etwas mehr Aufwand bei Disaster Recovery".

Wenn der LXC-PBS läuft, gucke ich mal ob ich nicht einen alten Laptop zum laufen bekomme, der dann auf die 20-TB-HDD sichert.

Wie viel RAM sollte ich in der Praxis für den LXC-PBS bereitstellen? Sollten es schon 4 GB sein? In dem Fall müsste ich direkt die LXC-Lösung skippen und direkt zum Laptop mit PBS greifen.
 
Zurück
Oben