it-swarm.dev

Mengapa Pekerjaan Batch AWS terjebak dalam RUNNABLE?

Saya menggunakan lingkungan komputasi 0-256 m3.medium pada instance permintaan. Definisi Pekerjaan saya membutuhkan 1 CPU dan Ram 3 GB, yang dimiliki oleh m3.medium.

Apa alasan yang memungkinkan mengapa AWS Batch Jobs terjebak dalam status RUNNABLE?

AWS mengatakan:

A job that resides in the queue, has no outstanding dependencies, and is therefore ready to be scheduled to a Host. Jobs in this state are started as soon as sufficient resources are available in one of the compute environments that are mapped to the job’s queue. However, jobs can remain in this state indefinitely when sufficient resources are unavailable.

tetapi itu tidak menjawab pertanyaan saya

17
arm

Ada alasan lain mengapa Ayub bisa mandek di RUNNABLE:

  • Izin yang tidak memadai untuk peran yang terkait dengan Lingkungan yang Dihitung
  • Tidak ada akses internet dari instance Compute Environment . Anda harus mengaitkan NAT atau Internet Gateway ke subnet Compute Environment .
    • Pastikan untuk memeriksa pengaturan "Aktifkan alamat IPv4 publik yang ditetapkan secara otomatis.". Pada subnet Lingkungan Komputer Anda. (Ditunjukkan oleh @ thisisbrians dalam komentar)
  • Masalah dengan gambar Anda . Anda perlu menggunakan AMI yang dioptimalkan oleh ECS atau pastikan agen kontainer ECS Anda berfungsi. Info lebih lanjut di aws docs
  • Anda mencoba meluncurkan instance yang akunnya terbatas pada 0 instance (EC2 console> limit, di menu sebelah kiri). (Baca lebih lanjut di komentar gergely-danyi )
  • Dan seperti yang disebutkan sumber daya tidak mencukupi

Juga, pastikan untuk membaca pemecahan masalah AWS Batch

18
nachoab

Peran harus didefinisikan menggunakan, setidaknya, kebijakan berikutnya dan hubungan tepercaya. Jika tidak, mereka akan terjebak dalam RUNNABLE karena mereka tidak memiliki cukup hak untuk memulai: 

 AWSBatchServiceRole

  • Kebijakan terlampir: AWSBatchServiceRole
  • Hubungan tepercaya: batch.amazonaws.com

    {
      "Version": "2012-10-17",
      "Statement": [
        {
          "Effect": "Allow",
          "Principal": {
             "Service": "batch.amazonaws.com"
           },
          "Action": "sts:AssumeRole"
        }
      ]
    }
    

ecsInstanceRole

  • Kebijakan terlampir: AmazonEC2ContainerServiceforEC2Role
  • Hubungan tepercaya: ec2.amazonaws.com

    {
      "Version": "2012-10-17",
      "Statement": [
        {
          "Effect": "Allow",
          "Principal": {
             "Service": "ec2.amazonaws.com"
           },
          "Action": "sts:AssumeRole"
        }
      ]
    }
    
4
Pau

Saya hanya berkelahi dengan ini sebentar, dan menemukan jawabannya .

Salah satu alasan mengapa pekerjaan bisa macet di Runnable adalah karena tidak ada contoh untuk menjalankan pekerjaan. Jika ini masalahnya, melihat grup penskalaan otomatis seperti yang disebutkan dalam jawaban di atas dapat menunjukkan kepada Anda kesalahan aktual yang mencegah dimulainya instance, memandu Anda ke masalah yang sebenarnya daripada membiarkan Anda mencoba sejumlah solusi untuk masalah yang sudah. Pesan kesalahan adalah teman kita.

1
Semimono

Lingkungan komputasi Anda mungkin tidak valid. Periksa Batch AWS -> Hitung Lingkungan -> kolom Status. Milik saya mengatakan tidak valid, dan simbol ini di sebelah nama lingkungan komputasi:

 enter image description here

Mengklik pada lingkungan komputasi memberi saya lebih banyak informasi - ID AMI saya salah.

0
Chris Anderson